pandas
Speichern Sie Pandas Dataframe in eine CSV-Datei
Suche…
Parameter
Parameter | Beschreibung |
---|---|
path_or_buf | String oder Datei-Handle, Standardwert None Dateipfad oder Objekt, wenn None angegeben ist, wird das Ergebnis als String zurückgegeben. |
sep | Zeichen, Standard ',' Feldtrennzeichen für die Ausgabedatei. |
na_rep | Zeichenfolge, Standardwert '' Fehlende Datendarstellung |
float_format | Zeichenfolge, Standardwert Keine Formatierungszeichenfolge für Gleitkommazahlen |
Säulen | Reihenfolge, optional zu schreibende Spalten |
Header | boolean oder Liste von Zeichenfolgen, Standardeinstellung True Write out-Spaltennamen. Wenn eine Liste mit Zeichenfolgen angegeben wird, wird davon ausgegangen, dass es sich um Aliase für die Spaltennamen handelt |
Index | boolean, Standard True Write Zeilennamen (Index) |
index_label | String oder Sequenz oder False, Standardwert Keine Spaltenbezeichnung für Indexspalte (n), falls gewünscht. Wenn None angegeben ist und Header und Index True sind, werden die Indexnamen verwendet. Eine Sequenz sollte angegeben werden, wenn der DataFrame MultiIndex verwendet. Bei False werden keine Felder für Indexnamen gedruckt. Verwenden Sie index_label = False, um das Importieren in R zu vereinfachen |
nanRep | Keine veraltet, verwenden Sie na_rep |
Modus | str Python-Schreibmodus, Standardeinstellung 'w' |
Codierung | string, optional Eine Zeichenfolge, die die Kodierung darstellt, die in der Ausgabedatei verwendet werden soll. Der Standardwert ist "ascii" in Python 2 und "utf-8" in Python 3. |
Kompression | Zeichenfolge, optional eine Zeichenfolge, die die in der Ausgabedatei zu verwendende Komprimierung darstellt. Zulässige Werte sind 'gzip', 'bz2', 'xz' und werden nur verwendet, wenn das erste Argument ein Dateiname ist |
line_terminator | string, default 'n' Das Zeilenvorschubzeichen oder die Zeichenfolge, die in der Ausgabedatei verwendet werden soll |
zitieren | Die optionale Konstante des csv-Moduls lautet standardmäßig csv.QUOTE_MINIMAL |
quotechar | Zeichenfolge (Länge 1), Standard-Zeichen "" für Anführungszeichen |
Doppelquote | boolean, Standard-True-Control-Anführungszeichen von quotechar in einem Feld |
escapechar | Zeichenfolge (Länge 1), Standardwert Kein Zeichen, das verwendet wird, um zwischen Sep und Quotechar zu wechseln |
chunksize | int oder Keine Zeilen, die gleichzeitig geschrieben werden sollen |
tupleize_cols | boolean, Standardwert False schreibt multi_index-Spalten als Liste von Tupeln (bei True) oder neu (erweitertes Format) bei False |
Datumsformat | Zeichenfolge, Standardwert Keine Formatierungszeichenfolge für datetime-Objekte |
Dezimal | Zeichenfolge, Standardwert '.' Zeichen als Dezimaltrennzeichen erkannt. Verwenden Sie beispielsweise ',' für europäische Daten |
Erstellen Sie einen zufälligen DataFrame und schreiben Sie in .csv
Erstellen Sie einen einfachen DataFrame.
import numpy as np
import pandas as pd
# Set the seed so that the numbers can be reproduced.
np.random.seed(0)
df = pd.DataFrame(np.random.randn(5, 3), columns=list('ABC'))
# Another way to set column names is "columns=['column_1_name','column_2_name','column_3_name']"
df
A B C
0 1.764052 0.400157 0.978738
1 2.240893 1.867558 -0.977278
2 0.950088 -0.151357 -0.103219
3 0.410599 0.144044 1.454274
4 0.761038 0.121675 0.443863
Schreiben Sie nun in eine CSV-Datei:
df.to_csv('example.csv', index=False)
Inhalte von example.csv:
A,B,C
1.76405234597,0.400157208367,0.978737984106
2.2408931992,1.86755799015,-0.977277879876
0.950088417526,-0.151357208298,-0.103218851794
0.410598501938,0.144043571161,1.45427350696
0.761037725147,0.121675016493,0.443863232745
Beachten Sie, dass wir index=False
angeben, damit die automatisch generierten Indizes (Zeilen # 0,1,2,3,4) nicht in der CSV-Datei enthalten sind. Fügen Sie es hinzu, wenn Sie die Indexspalte benötigen:
df.to_csv('example.csv', index=True) # Or just leave off the index param; default is True
Inhalte von example.csv:
,A,B,C
0,1.76405234597,0.400157208367,0.978737984106
1,2.2408931992,1.86755799015,-0.977277879876
2,0.950088417526,-0.151357208298,-0.103218851794
3,0.410598501938,0.144043571161,1.45427350696
4,0.761037725147,0.121675016493,0.443863232745
Beachten Sie auch, dass Sie den Header entfernen können, wenn er mit header=False
nicht benötigt wird. Dies ist die einfachste Ausgabe:
df.to_csv('example.csv', index=False, header=False)
Inhalte von example.csv:
1.76405234597,0.400157208367,0.978737984106
2.2408931992,1.86755799015,-0.977277879876
0.950088417526,-0.151357208298,-0.103218851794
0.410598501938,0.144043571161,1.45427350696
0.761037725147,0.121675016493,0.443863232745
Das Trennzeichen kann mit dem Argument sep=
, obwohl das Standard-Trennzeichen für CSV-Dateien ','
.
df.to_csv('example.csv', index=False, header=False, sep='\t')
1.76405234597 0.400157208367 0.978737984106
2.2408931992 1.86755799015 -0.977277879876
0.950088417526 -0.151357208298 -0.103218851794
0.410598501938 0.144043571161 1.45427350696
0.761037725147 0.121675016493 0.443863232745
Speichern Sie Pandas DataFrame von der Liste in die Diktiere ohne Index und mit Datenverschlüsselung
import pandas as pd
data = [
{'name': 'Daniel', 'country': 'Uganda'},
{'name': 'Yao', 'country': 'China'},
{'name': 'James', 'country': 'Colombia'},
]
df = pd.DataFrame(data)
filename = 'people.csv'
df.to_csv(filename, index=False, encoding='utf-8')
Modified text is an extract of the original Stack Overflow Documentation
Lizenziert unter CC BY-SA 3.0
Nicht angeschlossen an Stack Overflow