수색…
비고
일반적으로 Gotcha는 문서화되었지만 직관적이지는 않은 구조입니다. Gotchas는 반 직관적 인 특성 때문에 예상하지 못한 결과를 산출합니다.
Pandas 패키지에는 누군가를 혼란스럽게 할 수있는 몇 가지 문제점이 있으며이 중 일부는이 문서 페이지에 표시됩니다.
np.nan으로 누락 된 값 감지하기
미스를 감지하려면
df=pd.DataFrame({'col':[1,np.nan]})
df==np.nan
당신은 다음과 같은 결과를 얻을 것이다 :
col
0 False
1 False
누락 된 값을 비교하면 False가됩니다. 대신이 값을 사용해야합니다.
df=pd.DataFrame({'col':[1,np.nan]})
df.isnull()
결과는 다음과 같습니다.
col
0 False
1 True
정수 및 NA
팬더는 정수 유형의 속성에 누락을 지원하지 않습니다. 예를 들어 성적 항목에 누락이있는 경우 :
df= pd.read_csv("data.csv", dtype={'grade': int})
error: Integer column has NA values
이 경우에는 정수 대신 float를 사용하거나 dtype 객체를 설정해야합니다.
자동 데이터 정렬 (인덱스 인식 동작)
dataframe df의 열에 일련의 값 [1,2]을 추가하려면 NaN을 얻습니다.
import pandas as pd
series=pd.Series([1,2])
df=pd.DataFrame(index=[3,4])
df['col']=series
df
col
3 NaN
4 NaN
새 열을 설정하면 데이터가 인덱스에 의해 자동으로 정렬되고 값 1과 2는 데이터 프레임에서와 같이 인덱스 0과 1이 아닌 3과 4가됩니다.
df=pd.DataFrame(index=[1,2])
df['col']=series
df
col
1 2.0
2 NaN
색인을 무시하려면 끝에 .values를 설정해야합니다.
df['col']=series.values
col
3 1
4 2
Modified text is an extract of the original Stack Overflow Documentation
아래 라이선스 CC BY-SA 3.0
와 제휴하지 않음 Stack Overflow