खोज…
सरल श्रृंखला निर्माण उदाहरण
एक श्रृंखला एक आयाम डेटा संरचना है। यह एक सुपरचार्ज्ड सरणी या शब्दकोश की तरह एक सा है।
import pandas as pd
s = pd.Series([10, 20, 30])
>>> s
0 10
1 20
2 30
dtype: int64
एक श्रृंखला में हर मूल्य का एक सूचकांक होता है। डिफ़ॉल्ट रूप से, सूचक पूर्णांक होते हैं, 0 से श्रृंखला लंबाई शून्य से चल रहे हैं। 1. ऊपर दिए गए उदाहरण में आप मानों के बाईं ओर मुद्रित सूचकांक देख सकते हैं।
आप अपने स्वयं के सूचकांक निर्दिष्ट कर सकते हैं:
s2 = pd.Series([1.5, 2.5, 3.5], index=['a', 'b', 'c'], name='my_series')
>>> s2
a 1.5
b 2.5
c 3.5
Name: my_series, dtype: float64
s3 = pd.Series(['a', 'b', 'c'], index=list('ABC'))
>>> s3
A a
B b
C c
dtype: object
डेटाइम के साथ श्रृंखला
import pandas as pd
import numpy as np
np.random.seed(0)
rng = pd.date_range('2015-02-24', periods=5, freq='T')
s = pd.Series(np.random.randn(len(rng)), index=rng)
print (s)
2015-02-24 00:00:00 1.764052
2015-02-24 00:01:00 0.400157
2015-02-24 00:02:00 0.978738
2015-02-24 00:03:00 2.240893
2015-02-24 00:04:00 1.867558
Freq: T, dtype: float64
rng = pd.date_range('2015-02-24', periods=5, freq='T')
s1 = pd.Series(rng)
print (s1)
0 2015-02-24 00:00:00
1 2015-02-24 00:01:00
2 2015-02-24 00:02:00
3 2015-02-24 00:03:00
4 2015-02-24 00:04:00
dtype: datetime64[ns]
पंडों में सीरीज के बारे में कुछ त्वरित टिप्स
हमें लगता है कि हम निम्नलिखित श्रृंखला है:
>>> import pandas as pd
>>> s = pd.Series([1, 4, 6, 3, 8, 7, 4, 5])
>>> s
0 1
1 4
2 6
3 3
4 8
5 7
6 4
7 5
dtype: int64
अनुगमन कुछ सरल चीजें हैं जो श्रृंखला के साथ काम करते समय काम आती हैं:
की लंबाई पाने के लिए:
>>> len(s)
8
किसी तत्व को s में एक्सेस करने के लिए:
>>> s[4]
8
किसी तत्व को अनुक्रमणिका का उपयोग करने के लिए:
>>> s.loc[2]
6
एस के अंदर एक उप-श्रृंखला का उपयोग करने के लिए:
>>> s[1:3]
1 4
2 6
dtype: int64
5 से बड़े मूल्यों के साथ एस की एक उप-श्रृंखला प्राप्त करने के लिए:
>>> s[s > 5]
2 6
4 8
5 7
dtype: int64
न्यूनतम, अधिकतम, माध्य और मानक विचलन प्राप्त करने के लिए:
>>> s.min()
1
>>> s.max()
8
>>> s.mean()
4.75
>>> s.std()
2.2519832529192065
श्रृंखला प्रकार को फ्लोट में बदलने के लिए:
>>> s.astype(float)
0 1.0
1 4.0
2 6.0
3 3.0
4 8.0
5 7.0
6 4.0
7 5.0
dtype: float64
मानों को एक सुस्पष्ट सरणी के रूप में प्राप्त करने के लिए:
>>> s.values
array([1, 4, 6, 3, 8, 7, 4, 5])
की प्रतिलिपि बनाने के लिए:
>>> d = s.copy()
>>> d
0 1
1 4
2 6
3 3
4 8
5 7
6 4
7 5
dtype: int64
एक श्रृंखला के लिए एक कार्य को लागू करना
पंडों श्रृंखला के प्रत्येक तत्व को एक समारोह लागू करने और एक नई श्रृंखला प्राप्त करने के लिए एक प्रभावी तरीका प्रदान करता है। हमें लगता है कि हम निम्नलिखित श्रृंखला है:
>>> import pandas as pd
>>> s = pd.Series([3, 7, 5, 8, 9, 1, 0, 4])
>>> s
0 3
1 7
2 5
3 8
4 9
5 1
6 0
7 4
dtype: int64
और एक वर्ग समारोह:
>>> def square(x):
... return x*x
हम बस के हर तत्व के लिए वर्ग को लागू कर सकते हैं और एक नई श्रृंखला प्राप्त कर सकते हैं:
>>> t = s.apply(square)
>>> t
0 9
1 49
2 25
3 64
4 81
5 1
6 0
7 16
dtype: int64
कुछ मामलों में लंबोदर अभिव्यक्ति का उपयोग करना आसान है:
>>> s.apply(lambda x: x ** 2)
0 9
1 49
2 25
3 64
4 81
5 1
6 0
7 16
dtype: int64
या हम किसी भी निर्मित समारोह का उपयोग कर सकते हैं:
>>> q = pd.Series(['Bob', 'Jack', 'Rose'])
>>> q.apply(str.lower)
0 bob
1 jack
2 rose
dtype: object
यदि श्रृंखला के सभी तत्व तार हैं, तो स्ट्रिंग विधियों को लागू करने का एक आसान तरीका है:
>>> q.str.lower()
0 bob
1 jack
2 rose
dtype: object
>>> q.str.len()
0 3
1 4
2 4