खोज…


डेटाफ़्रेम जानकारी और मेमोरी उपयोग प्राप्त करें

स्तंभ नाम और डेटाटाइप सहित डेटाफ़्रेम के बारे में बुनियादी जानकारी प्राप्त करने के लिए:

import pandas as pd

df = pd.DataFrame({'integers': [1, 2, 3], 
                   'floats': [1.5, 2.5, 3], 
                   'text': ['a', 'b', 'c'], 
                   'ints with None': [1, None, 3]})

df.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 3 entries, 0 to 2
Data columns (total 4 columns):
floats            3 non-null float64
integers          3 non-null int64
ints with None    2 non-null float64
text              3 non-null object
dtypes: float64(2), int64(1), object(1)
memory usage: 120.0+ bytes

DataFrame की मेमोरी उपयोग प्राप्त करने के लिए:

>>> df.info(memory_usage='deep')
<class 'pandas.core.frame.DataFrame'>
Int64Index: 3 entries, 0 to 2
Data columns (total 4 columns):
floats            3 non-null float64
integers          3 non-null int64
ints with None    2 non-null float64
text              3 non-null object
dtypes: float64(2), int64(1), object(1)
memory usage: 234.0 bytes

DataFrame कॉलम नामों की सूची बनाएं

df = pd.DataFrame({'a': [1, 2, 3], 'b': [4, 5, 6], 'c': [7, 8, 9]})

DataFrame में कॉलम के नामों को सूचीबद्ध करने के लिए:

>>> list(df)
['a', 'b', 'c']

डीबगर का उपयोग करते समय यह सूची समझने की विधि विशेष रूप से उपयोगी है:

>>> [c for c in df]
['a', 'b', 'c']

यह लंबा रास्ता है:

sampledf.columns.tolist()

आप उन्हें एक सूची के बजाय एक सूचकांक के रूप में भी प्रिंट कर सकते हैं (हालांकि यह कई कॉलम वाले डेटाफ्रेम के लिए बहुत दृश्यमान नहीं होगा):

df.columns

डेटाफ्रेम के विभिन्न सारांश आँकड़े।

import pandas as pd
df = pd.DataFrame(np.random.randn(5, 5), columns=list('ABCDE'))

विभिन्न सारांश आँकड़े उत्पन्न करने के लिए। संख्यात्मक मानों के लिए गैर-NA / शून्य मानों की count ( count ), माध्य ( mean ), मानक विचलन std और मान जिन्हें पांच-संख्या सारांश के रूप में जाना जाता है:

  • min : न्यूनतम (सबसे छोटा अवलोकन)
  • 25% : निचला चतुर्थक या पहला चतुर्थक (Q1)
  • 50% : मंझला (मध्य मूल्य, Q2)
  • 75% : ऊपरी चतुर्थक या तृतीय चतुर्थक (Q3)
  • max : अधिकतम (सबसे बड़ा अवलोकन)
>>> df.describe()
              A         B         C         D         E
count  5.000000  5.000000  5.000000  5.000000  5.000000
mean  -0.456917 -0.278666  0.334173  0.863089  0.211153
std    0.925617  1.091155  1.024567  1.238668  1.495219
min   -1.494346 -2.031457 -0.336471 -0.821447 -2.106488
25%   -1.143098 -0.407362 -0.246228 -0.087088 -0.082451
50%   -0.536503 -0.163950 -0.004099  1.509749  0.313918
75%    0.092630  0.381407  0.120137  1.822794  1.060268
max    0.796729  0.828034  2.137527  1.891436  1.870520


Modified text is an extract of the original Stack Overflow Documentation
के तहत लाइसेंस प्राप्त है CC BY-SA 3.0
से संबद्ध नहीं है Stack Overflow