Suche…


Parameter

Parameter Beschreibung
path_or_buf String oder Datei-Handle, Standardwert None Dateipfad oder Objekt, wenn None angegeben ist, wird das Ergebnis als String zurückgegeben.
sep Zeichen, Standard ',' Feldtrennzeichen für die Ausgabedatei.
na_rep Zeichenfolge, Standardwert '' Fehlende Datendarstellung
float_format Zeichenfolge, Standardwert Keine Formatierungszeichenfolge für Gleitkommazahlen
Säulen Reihenfolge, optional zu schreibende Spalten
Header boolean oder Liste von Zeichenfolgen, Standardeinstellung True Write out-Spaltennamen. Wenn eine Liste mit Zeichenfolgen angegeben wird, wird davon ausgegangen, dass es sich um Aliase für die Spaltennamen handelt
Index boolean, Standard True Write Zeilennamen (Index)
index_label String oder Sequenz oder False, Standardwert Keine Spaltenbezeichnung für Indexspalte (n), falls gewünscht. Wenn None angegeben ist und Header und Index True sind, werden die Indexnamen verwendet. Eine Sequenz sollte angegeben werden, wenn der DataFrame MultiIndex verwendet. Bei False werden keine Felder für Indexnamen gedruckt. Verwenden Sie index_label = False, um das Importieren in R zu vereinfachen
nanRep Keine veraltet, verwenden Sie na_rep
Modus str Python-Schreibmodus, Standardeinstellung 'w'
Codierung string, optional Eine Zeichenfolge, die die Kodierung darstellt, die in der Ausgabedatei verwendet werden soll. Der Standardwert ist "ascii" in Python 2 und "utf-8" in Python 3.
Kompression Zeichenfolge, optional eine Zeichenfolge, die die in der Ausgabedatei zu verwendende Komprimierung darstellt. Zulässige Werte sind 'gzip', 'bz2', 'xz' und werden nur verwendet, wenn das erste Argument ein Dateiname ist
line_terminator string, default 'n' Das Zeilenvorschubzeichen oder die Zeichenfolge, die in der Ausgabedatei verwendet werden soll
zitieren Die optionale Konstante des csv-Moduls lautet standardmäßig csv.QUOTE_MINIMAL
quotechar Zeichenfolge (Länge 1), Standard-Zeichen "" für Anführungszeichen
Doppelquote boolean, Standard-True-Control-Anführungszeichen von quotechar in einem Feld
escapechar Zeichenfolge (Länge 1), Standardwert Kein Zeichen, das verwendet wird, um zwischen Sep und Quotechar zu wechseln
chunksize int oder Keine Zeilen, die gleichzeitig geschrieben werden sollen
tupleize_cols boolean, Standardwert False schreibt multi_index-Spalten als Liste von Tupeln (bei True) oder neu (erweitertes Format) bei False
Datumsformat Zeichenfolge, Standardwert Keine Formatierungszeichenfolge für datetime-Objekte
Dezimal Zeichenfolge, Standardwert '.' Zeichen als Dezimaltrennzeichen erkannt. Verwenden Sie beispielsweise ',' für europäische Daten

Erstellen Sie einen zufälligen DataFrame und schreiben Sie in .csv

Erstellen Sie einen einfachen DataFrame.

import numpy as np
import pandas as pd

# Set the seed so that the numbers can be reproduced.
np.random.seed(0)  

df = pd.DataFrame(np.random.randn(5, 3), columns=list('ABC'))

# Another way to set column names is "columns=['column_1_name','column_2_name','column_3_name']"

df

      A         B         C
0  1.764052  0.400157  0.978738
1  2.240893  1.867558 -0.977278
2  0.950088 -0.151357 -0.103219
3  0.410599  0.144044  1.454274
4  0.761038  0.121675  0.443863

Schreiben Sie nun in eine CSV-Datei:

df.to_csv('example.csv', index=False)

Inhalte von example.csv:

A,B,C
1.76405234597,0.400157208367,0.978737984106
2.2408931992,1.86755799015,-0.977277879876
0.950088417526,-0.151357208298,-0.103218851794
0.410598501938,0.144043571161,1.45427350696
0.761037725147,0.121675016493,0.443863232745

Beachten Sie, dass wir index=False angeben, damit die automatisch generierten Indizes (Zeilen # 0,1,2,3,4) nicht in der CSV-Datei enthalten sind. Fügen Sie es hinzu, wenn Sie die Indexspalte benötigen:

df.to_csv('example.csv', index=True)  # Or just leave off the index param; default is True

Inhalte von example.csv:

,A,B,C
0,1.76405234597,0.400157208367,0.978737984106
1,2.2408931992,1.86755799015,-0.977277879876
2,0.950088417526,-0.151357208298,-0.103218851794
3,0.410598501938,0.144043571161,1.45427350696
4,0.761037725147,0.121675016493,0.443863232745

Beachten Sie auch, dass Sie den Header entfernen können, wenn er mit header=False nicht benötigt wird. Dies ist die einfachste Ausgabe:

df.to_csv('example.csv', index=False, header=False)

Inhalte von example.csv:

1.76405234597,0.400157208367,0.978737984106
2.2408931992,1.86755799015,-0.977277879876
0.950088417526,-0.151357208298,-0.103218851794
0.410598501938,0.144043571161,1.45427350696
0.761037725147,0.121675016493,0.443863232745

Das Trennzeichen kann mit dem Argument sep= , obwohl das Standard-Trennzeichen für CSV-Dateien ',' .

df.to_csv('example.csv', index=False, header=False, sep='\t')

1.76405234597    0.400157208367    0.978737984106
2.2408931992    1.86755799015    -0.977277879876
0.950088417526    -0.151357208298    -0.103218851794
0.410598501938    0.144043571161    1.45427350696
0.761037725147    0.121675016493    0.443863232745

Speichern Sie Pandas DataFrame von der Liste in die Diktiere ohne Index und mit Datenverschlüsselung

import pandas as pd
data = [
    {'name': 'Daniel', 'country': 'Uganda'},
    {'name': 'Yao', 'country': 'China'},
    {'name': 'James', 'country': 'Colombia'},
]
df = pd.DataFrame(data)
filename = 'people.csv'
df.to_csv(filename, index=False, encoding='utf-8')


Modified text is an extract of the original Stack Overflow Documentation
Lizenziert unter CC BY-SA 3.0
Nicht angeschlossen an Stack Overflow