pandas
पंडों के गोत्र
खोज…
टिप्पणियों
गोत्चा सामान्य रूप से एक ऐसा निर्माण है जो हालांकि प्रलेखित है, लेकिन सहज नहीं है। गोचच कुछ आउटपुट का उत्पादन करता है जो आमतौर पर इसके काउंटर-सहज चरित्र के कारण अपेक्षित नहीं है।
पंडों के पैकेज में कई गोचर्स होते हैं, जो किसी को भ्रमित कर सकते हैं, जिन्हें उनके बारे में जानकारी नहीं है, और उनमें से कुछ इस प्रलेखन पृष्ठ पर प्रस्तुत किए गए हैं।
Np.nan के साथ लापता मूल्यों का पता लगाना
अगर आप के साथ मिसिंग का पता लगाना चाहते हैं
df=pd.DataFrame({'col':[1,np.nan]})
df==np.nan
आपको निम्न परिणाम मिलेगा:
col
0 False
1 False
ऐसा इसलिए है क्योंकि किसी भी परिणाम के लिए अनुपलब्ध मूल्य की तुलना एक गलत परिणाम में होती है - इसके बजाय आपको इसका उपयोग करना चाहिए
df=pd.DataFrame({'col':[1,np.nan]})
df.isnull()
जिसके परिणामस्वरूप:
col
0 False
1 True
पूर्णांक और एनए
पंडों प्रकार पूर्णांक की विशेषताओं में लापता का समर्थन नहीं करते। उदाहरण के लिए यदि आपके पास ग्रेड कॉलम में मिसिंग है:
df= pd.read_csv("data.csv", dtype={'grade': int})
error: Integer column has NA values
इस स्थिति में आपको पूर्णांक के बजाय फ्लोट का उपयोग करना चाहिए या ऑब्जेक्ट dtype सेट करना चाहिए।
स्वचालित डेटा संरेखण (अनुक्रमणिका-व्यवहार)
यदि आप डेटाफ्रेम df के कॉलम में मानों की एक श्रृंखला [1,2] जोड़ना चाहते हैं, तो आपको NaNs मिलेगा:
import pandas as pd
series=pd.Series([1,2])
df=pd.DataFrame(index=[3,4])
df['col']=series
df
col
3 NaN
4 NaN
क्योंकि एक नया कॉलम सेट करने से इंडेक्स द्वारा डेटा को स्वचालित रूप से संरेखित किया जाता है, और आपके मान 1 और 2 को 0 और 1 इंडेक्स मिलेंगे, और आपके डेटा फ़्रेम में 3 और 4 नहीं:
df=pd.DataFrame(index=[1,2])
df['col']=series
df
col
1 2.0
2 NaN
यदि आप सूचकांक को अनदेखा करना चाहते हैं, तो आपको अंत में .values निर्धारित करना चाहिए:
df['col']=series.values
col
3 1
4 2