pandas
Spara pandas dataframe i en csv-fil
Sök…
parametrar
Parameter | Beskrivning |
---|---|
path_or_buf | sträng eller filhandtag, standard Ingen fil sökväg eller objekt, om inget tillhandahålls returneras resultatet som en sträng. |
september | karaktär, standard ',' Fältavgränsare för utdatafilen. |
na_rep | sträng, standard '' Saknar datarepresentation |
float_format | sträng, standard Ingen Formatera sträng för flytande punktnummer |
kolonner | sekvens, valfria kolumner att skriva |
rubrik | booleska eller lista med strängar, standard True Skriv ut kolumnnamn. Om en lista med sträng anges antas det vara alias för kolumnnamnen |
index | boolean, standard True Writ radnamn (index) |
index_label | sträng eller sekvens eller False, standard Ingen kolumnetikett för indexkolumn (er) om så önskas. Om ingen anges, och rubrik och index är sanna, används indexnamnen. En sekvens bör ges om DataFrame använder MultiIndex. Om False skriver inte ut fält för indexnamn. Använd index_label = False för enklare import i R |
nanRep | Ingen avskrivs, använd na_rep |
läge | str Python-skrivläge, standard 'w' |
kodning | sträng, valfri En sträng som representerar den kodning som ska användas i utdatafilen, är som standard 'ascii' på Python 2 och 'utf-8' på Python 3. |
kompression | sträng, valfri en sträng som representerar den komprimering som ska användas i utdatafilen, tillåtna värden är 'gzip', 'bz2', 'xz', endast används när det första argumentet är ett filnamn |
line_terminator | string, default 'n' Det nya linjetecknet eller teckensekvensen som ska användas i utdatafilen |
citera | valfri konstant från csv-modul som standard till csv.QUOTE_MINIMAL |
quotechar | sträng (längd 1), standardtecken som används för att citera fält |
doublequote | boolean, standard True Control-citering av quotechar i ett fält |
escapechar | sträng (längd 1), standard Inget tecken som används för att undgå sep och quotechar när det är lämpligt |
CHUNKSIZE | int eller Ingen rader att skriva åt gången |
tupleize_cols | booleska, standard False skriva multi_index-kolumner som en lista med tuplingar (om sant) eller nytt (utökat format) om falskt) |
datumformat | sträng, standard Ingen Formatera sträng för datetime-objekt |
decimal | sträng, standard '.' Tecken som känns igen som decimalavskiljare. Använd t.ex. ',' för europeiska data |
Skapa slumpmässig DataFrame och skriv till .csv
Skapa en enkel DataFrame.
import numpy as np
import pandas as pd
# Set the seed so that the numbers can be reproduced.
np.random.seed(0)
df = pd.DataFrame(np.random.randn(5, 3), columns=list('ABC'))
# Another way to set column names is "columns=['column_1_name','column_2_name','column_3_name']"
df
A B C
0 1.764052 0.400157 0.978738
1 2.240893 1.867558 -0.977278
2 0.950088 -0.151357 -0.103219
3 0.410599 0.144044 1.454274
4 0.761038 0.121675 0.443863
Skriv nu till en CSV-fil:
df.to_csv('example.csv', index=False)
Innehållet av example.csv:
A,B,C
1.76405234597,0.400157208367,0.978737984106
2.2408931992,1.86755799015,-0.977277879876
0.950088417526,-0.151357208298,-0.103218851794
0.410598501938,0.144043571161,1.45427350696
0.761037725147,0.121675016493,0.443863232745
Observera att vi anger index=False
så att de autogenererade indexen (rad #s 0,1,2,3,4) inte ingår i CSV-filen. Inkludera den om du behöver indexkolumnen, så:
df.to_csv('example.csv', index=True) # Or just leave off the index param; default is True
Innehållet av example.csv:
,A,B,C
0,1.76405234597,0.400157208367,0.978737984106
1,2.2408931992,1.86755799015,-0.977277879876
2,0.950088417526,-0.151357208298,-0.103218851794
3,0.410598501938,0.144043571161,1.45427350696
4,0.761037725147,0.121675016493,0.443863232745
Observera också att du kan ta bort rubriken om det inte behövs med header=False
. Detta är den enklaste utgången:
df.to_csv('example.csv', index=False, header=False)
Innehållet av example.csv:
1.76405234597,0.400157208367,0.978737984106
2.2408931992,1.86755799015,-0.977277879876
0.950088417526,-0.151357208298,-0.103218851794
0.410598501938,0.144043571161,1.45427350696
0.761037725147,0.121675016493,0.443863232745
Avgränsaren kan ställas in med sep=
argument, även om standardseparatorn för csv-filer är ','
.
df.to_csv('example.csv', index=False, header=False, sep='\t')
1.76405234597 0.400157208367 0.978737984106
2.2408931992 1.86755799015 -0.977277879876
0.950088417526 -0.151357208298 -0.103218851794
0.410598501938 0.144043571161 1.45427350696
0.761037725147 0.121675016493 0.443863232745
Spara Pandas DataFrame från listan till dikt till csv utan index och med datakodning
import pandas as pd
data = [
{'name': 'Daniel', 'country': 'Uganda'},
{'name': 'Yao', 'country': 'China'},
{'name': 'James', 'country': 'Colombia'},
]
df = pd.DataFrame(data)
filename = 'people.csv'
df.to_csv(filename, index=False, encoding='utf-8')
Modified text is an extract of the original Stack Overflow Documentation
Licensierat under CC BY-SA 3.0
Inte anslutet till Stack Overflow