Sök…


Anmärkningar

Gotcha i allmänhet är en konstruktion som är dokumenterad men inte intuitiv. Gotchas producerar viss produktion som normalt inte förväntas på grund av dess motintuitiva karaktär.

Pandas-paketet har flera gotchor, som kan förvirra någon, som inte känner till dem, och några av dem presenteras på denna dokumentationssida.

Upptäcker saknade värden med np.nan

Om du vill upptäcka missioner med

df=pd.DataFrame({'col':[1,np.nan]})
df==np.nan

får du följande resultat:

col
0    False
1    False

Detta beror på att jämföra saknad värde med någonting resulterar i ett falskt - istället för detta bör du använda

df=pd.DataFrame({'col':[1,np.nan]})   
df.isnull()

vilket resulterar i:

col
0    False
1    True

Heltal och NA

Pandor stöder inte saknas i attribut av typ heltal. Till exempel om du har missat i betygskolumnen:

df= pd.read_csv("data.csv", dtype={'grade': int}) 
error: Integer column has NA values

I det här fallet bör du bara använda float istället för heltal eller ställa in objektet dtype.

Automatisk datainriktning (index-awared beteende)

Om du vill lägga till en serie värden [1,2] i kolumnen med dataframe df får du NaN:

import pandas as pd

series=pd.Series([1,2])
df=pd.DataFrame(index=[3,4])
df['col']=series
df

   col
3    NaN
4    NaN

eftersom inställningen av en ny kolumn anpassar data automatiskt efter indexet, och dina värden 1 och 2 skulle få indexen 0 och 1 och inte 3 och 4 som i din dataram:

df=pd.DataFrame(index=[1,2])
df['col']=series
df

   col
1      2.0
2      NaN

Om du vill ignorera index bör du ställa in .värdena i slutet:

df['col']=series.values

   col
3    1
4    2


Modified text is an extract of the original Stack Overflow Documentation
Licensierat under CC BY-SA 3.0
Inte anslutet till Stack Overflow