pandas
DataFrames के बारे में जानकारी प्राप्त करना
खोज…
डेटाफ़्रेम जानकारी और मेमोरी उपयोग प्राप्त करें
स्तंभ नाम और डेटाटाइप सहित डेटाफ़्रेम के बारे में बुनियादी जानकारी प्राप्त करने के लिए:
import pandas as pd
df = pd.DataFrame({'integers': [1, 2, 3],
'floats': [1.5, 2.5, 3],
'text': ['a', 'b', 'c'],
'ints with None': [1, None, 3]})
df.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 3 entries, 0 to 2
Data columns (total 4 columns):
floats 3 non-null float64
integers 3 non-null int64
ints with None 2 non-null float64
text 3 non-null object
dtypes: float64(2), int64(1), object(1)
memory usage: 120.0+ bytes
DataFrame की मेमोरी उपयोग प्राप्त करने के लिए:
>>> df.info(memory_usage='deep')
<class 'pandas.core.frame.DataFrame'>
Int64Index: 3 entries, 0 to 2
Data columns (total 4 columns):
floats 3 non-null float64
integers 3 non-null int64
ints with None 2 non-null float64
text 3 non-null object
dtypes: float64(2), int64(1), object(1)
memory usage: 234.0 bytes
DataFrame कॉलम नामों की सूची बनाएं
df = pd.DataFrame({'a': [1, 2, 3], 'b': [4, 5, 6], 'c': [7, 8, 9]})
DataFrame में कॉलम के नामों को सूचीबद्ध करने के लिए:
>>> list(df)
['a', 'b', 'c']
डीबगर का उपयोग करते समय यह सूची समझने की विधि विशेष रूप से उपयोगी है:
>>> [c for c in df]
['a', 'b', 'c']
यह लंबा रास्ता है:
sampledf.columns.tolist()
आप उन्हें एक सूची के बजाय एक सूचकांक के रूप में भी प्रिंट कर सकते हैं (हालांकि यह कई कॉलम वाले डेटाफ्रेम के लिए बहुत दृश्यमान नहीं होगा):
df.columns
डेटाफ्रेम के विभिन्न सारांश आँकड़े।
import pandas as pd
df = pd.DataFrame(np.random.randn(5, 5), columns=list('ABCDE'))
विभिन्न सारांश आँकड़े उत्पन्न करने के लिए। संख्यात्मक मानों के लिए गैर-NA / शून्य मानों की count
( count
), माध्य ( mean
), मानक विचलन std
और मान जिन्हें पांच-संख्या सारांश के रूप में जाना जाता है:
-
min
: न्यूनतम (सबसे छोटा अवलोकन) -
25%
: निचला चतुर्थक या पहला चतुर्थक (Q1) -
50%
: मंझला (मध्य मूल्य, Q2) -
75%
: ऊपरी चतुर्थक या तृतीय चतुर्थक (Q3) -
max
: अधिकतम (सबसे बड़ा अवलोकन)
>>> df.describe()
A B C D E
count 5.000000 5.000000 5.000000 5.000000 5.000000
mean -0.456917 -0.278666 0.334173 0.863089 0.211153
std 0.925617 1.091155 1.024567 1.238668 1.495219
min -1.494346 -2.031457 -0.336471 -0.821447 -2.106488
25% -1.143098 -0.407362 -0.246228 -0.087088 -0.082451
50% -0.536503 -0.163950 -0.004099 1.509749 0.313918
75% 0.092630 0.381407 0.120137 1.822794 1.060268
max 0.796729 0.828034 2.137527 1.891436 1.870520
Modified text is an extract of the original Stack Overflow Documentation
के तहत लाइसेंस प्राप्त है CC BY-SA 3.0
से संबद्ध नहीं है Stack Overflow