수색…


비고

일반적으로 Gotcha는 문서화되었지만 직관적이지는 않은 구조입니다. Gotchas는 반 직관적 인 특성 때문에 예상하지 못한 결과를 산출합니다.

Pandas 패키지에는 누군가를 혼란스럽게 할 수있는 몇 가지 문제점이 있으며이 중 일부는이 문서 페이지에 표시됩니다.

np.nan으로 누락 된 값 감지하기

미스를 감지하려면

df=pd.DataFrame({'col':[1,np.nan]})
df==np.nan

당신은 다음과 같은 결과를 얻을 것이다 :

col
0    False
1    False

누락 된 값을 비교하면 False가됩니다. 대신이 값을 사용해야합니다.

df=pd.DataFrame({'col':[1,np.nan]})   
df.isnull()

결과는 다음과 같습니다.

col
0    False
1    True

정수 및 NA

팬더는 정수 유형의 속성에 누락을 지원하지 않습니다. 예를 들어 성적 항목에 누락이있는 경우 :

df= pd.read_csv("data.csv", dtype={'grade': int}) 
error: Integer column has NA values

이 경우에는 정수 대신 float를 사용하거나 dtype 객체를 설정해야합니다.

자동 데이터 정렬 (인덱스 인식 동작)

dataframe df의 열에 일련의 값 [1,2]을 추가하려면 NaN을 얻습니다.

import pandas as pd

series=pd.Series([1,2])
df=pd.DataFrame(index=[3,4])
df['col']=series
df

   col
3    NaN
4    NaN

새 열을 설정하면 데이터가 인덱스에 의해 자동으로 정렬되고 값 1과 2는 데이터 프레임에서와 같이 인덱스 0과 1이 아닌 3과 4가됩니다.

df=pd.DataFrame(index=[1,2])
df['col']=series
df

   col
1      2.0
2      NaN

색인을 무시하려면 끝에 .values를 설정해야합니다.

df['col']=series.values

   col
3    1
4    2


Modified text is an extract of the original Stack Overflow Documentation
아래 라이선스 CC BY-SA 3.0
와 제휴하지 않음 Stack Overflow