수색…


간단한 시리즈 생성 예제

시리즈는 1 차원 데이터 구조입니다. 슈퍼 차지 어레이 나 사전과 같습니다.

import pandas as pd

s = pd.Series([10, 20, 30])

>>> s
0    10
1    20
2    30
dtype: int64

시리즈의 모든 값에는 색인이 있습니다. 기본적으로 인덱스는 0부터 계열 길이 빼기 1까지의 정수입니다. 위의 예에서 값의 왼쪽에 인쇄 된 인덱스를 볼 수 있습니다.

자신 만의 인덱스를 지정할 수 있습니다.

s2 = pd.Series([1.5, 2.5, 3.5], index=['a', 'b', 'c'], name='my_series')

>>> s2
a    1.5
b    2.5
c    3.5
Name: my_series, dtype: float64

s3 = pd.Series(['a', 'b', 'c'], index=list('ABC'))

>>> s3
A    a
B    b
C    c
dtype: object

날짜 시간이있는 시리즈

import pandas as pd
import numpy as np

np.random.seed(0)
rng = pd.date_range('2015-02-24', periods=5, freq='T')
s = pd.Series(np.random.randn(len(rng)), index=rng)  
print (s)

2015-02-24 00:00:00    1.764052
2015-02-24 00:01:00    0.400157
2015-02-24 00:02:00    0.978738
2015-02-24 00:03:00    2.240893
2015-02-24 00:04:00    1.867558
Freq: T, dtype: float64

rng = pd.date_range('2015-02-24', periods=5, freq='T')
s1 = pd.Series(rng)  
print (s1)

0   2015-02-24 00:00:00
1   2015-02-24 00:01:00
2   2015-02-24 00:02:00
3   2015-02-24 00:03:00
4   2015-02-24 00:04:00
dtype: datetime64[ns]

팬더 시리즈에 대한 몇 가지 간단한 팁

우리는 다음 시리즈를 가지고 있다고 가정합시다 :

>>> import pandas as pd
>>> s = pd.Series([1, 4, 6, 3, 8, 7, 4, 5])
>>> s
0    1
1    4
2    6
3    3
4    8
5    7
6    4
7    5
dtype: int64

다음은 Series로 작업 할 때 편리하게 사용할 수있는 간단한 몇 가지 사항입니다.

s의 길이를 얻으려면 :

>>> len(s)
8

s의 요소에 액세스하려면 :

>>> s[4]
8

색인을 사용하는 요소에 액세스하려면 :

>>> s.loc[2]
6

s 내의 하위 시리즈에 액세스하려면 :

>>> s[1:3]
1    4
2    6
dtype: int64

값이 5보다 큰 s의 하위 계열을 가져 오려면 다음을 수행하십시오.

>>> s[s > 5]
2    6
4    8
5    7
dtype: int64

최소, 최대, 평균 및 표준 편차를 얻으려면 :

>>> s.min()
1
>>> s.max()
8
>>> s.mean()
4.75
>>> s.std()
2.2519832529192065

Series 유형을 float로 변환하려면 :

>>> s.astype(float)
0    1.0
1    4.0
2    6.0
3    3.0
4    8.0
5    7.0
6    4.0
7    5.0
dtype: float64

numpy 배열로서 s의 값을 얻으려면 :

>>> s.values
array([1, 4, 6, 3, 8, 7, 4, 5])

s의 복사본을 만들려면 :

>>> d = s.copy()
>>> d
0    1
1    4
2    6
3    3
4    8
5    7
6    4
7    5
dtype: int64

시리즈에 함수 적용하기

팬더는 시리즈의 모든 요소에 기능을 적용하고 새로운 시리즈를 만드는 효과적인 방법을 제공합니다. 우리는 다음 시리즈를 가지고 있다고 가정합시다 :

>>> import pandas as pd
>>> s = pd.Series([3, 7, 5, 8, 9, 1, 0, 4])
>>> s
0    3
1    7
2    5
3    8
4    9
5    1
6    0
7    4
dtype: int64

및 제곱 함수 :

>>> def square(x):
...     return x*x

S의 모든 요소에 정사각형을 적용하고 새로운 Series를 얻을 수 있습니다.

>>> t = s.apply(square)
>>> t
0     9
1    49
2    25
3    64
4    81
5     1
6     0
7    16
dtype: int64

경우에 따라 람다 식을 사용하는 것이 더 쉽습니다.

>>> s.apply(lambda x: x ** 2)
0     9
1    49
2    25
3    64
4    81
5     1
6     0
7    16
dtype: int64

또는 내장 함수를 사용할 수 있습니다.

>>> q = pd.Series(['Bob', 'Jack', 'Rose'])
>>> q.apply(str.lower)
0     bob
1    jack
2    rose
dtype: object

Series의 모든 요소가 문자열 인 경우 문자열 메서드를 적용하는 더 쉬운 방법이 있습니다.

>>> q.str.lower()
0     bob
1    jack
2    rose
dtype: object
>>> q.str.len()
0    3
1    4
2    4


Modified text is an extract of the original Stack Overflow Documentation
아래 라이선스 CC BY-SA 3.0
와 제휴하지 않음 Stack Overflow