खोज…


टिप्पणियों

गोत्चा सामान्य रूप से एक ऐसा निर्माण है जो हालांकि प्रलेखित है, लेकिन सहज नहीं है। गोचच कुछ आउटपुट का उत्पादन करता है जो आमतौर पर इसके काउंटर-सहज चरित्र के कारण अपेक्षित नहीं है।

पंडों के पैकेज में कई गोचर्स होते हैं, जो किसी को भ्रमित कर सकते हैं, जिन्हें उनके बारे में जानकारी नहीं है, और उनमें से कुछ इस प्रलेखन पृष्ठ पर प्रस्तुत किए गए हैं।

Np.nan के साथ लापता मूल्यों का पता लगाना

अगर आप के साथ मिसिंग का पता लगाना चाहते हैं

df=pd.DataFrame({'col':[1,np.nan]})
df==np.nan

आपको निम्न परिणाम मिलेगा:

col
0    False
1    False

ऐसा इसलिए है क्योंकि किसी भी परिणाम के लिए अनुपलब्ध मूल्य की तुलना एक गलत परिणाम में होती है - इसके बजाय आपको इसका उपयोग करना चाहिए

df=pd.DataFrame({'col':[1,np.nan]})   
df.isnull()

जिसके परिणामस्वरूप:

col
0    False
1    True

पूर्णांक और एनए

पंडों प्रकार पूर्णांक की विशेषताओं में लापता का समर्थन नहीं करते। उदाहरण के लिए यदि आपके पास ग्रेड कॉलम में मिसिंग है:

df= pd.read_csv("data.csv", dtype={'grade': int}) 
error: Integer column has NA values

इस स्थिति में आपको पूर्णांक के बजाय फ्लोट का उपयोग करना चाहिए या ऑब्जेक्ट dtype सेट करना चाहिए।

स्वचालित डेटा संरेखण (अनुक्रमणिका-व्यवहार)

यदि आप डेटाफ्रेम df के कॉलम में मानों की एक श्रृंखला [1,2] जोड़ना चाहते हैं, तो आपको NaNs मिलेगा:

import pandas as pd

series=pd.Series([1,2])
df=pd.DataFrame(index=[3,4])
df['col']=series
df

   col
3    NaN
4    NaN

क्योंकि एक नया कॉलम सेट करने से इंडेक्स द्वारा डेटा को स्वचालित रूप से संरेखित किया जाता है, और आपके मान 1 और 2 को 0 और 1 इंडेक्स मिलेंगे, और आपके डेटा फ़्रेम में 3 और 4 नहीं:

df=pd.DataFrame(index=[1,2])
df['col']=series
df

   col
1      2.0
2      NaN

यदि आप सूचकांक को अनदेखा करना चाहते हैं, तो आपको अंत में .values निर्धारित करना चाहिए:

df['col']=series.values

   col
3    1
4    2


Modified text is an extract of the original Stack Overflow Documentation
के तहत लाइसेंस प्राप्त है CC BY-SA 3.0
से संबद्ध नहीं है Stack Overflow