Поиск…


параметры

параметр Описание
path_or_buf string или file handle, по умолчанию None Путь к файлу или объект, если None предоставлен, результат возвращается как строка.
сентябрь character, default ',' Разделитель полей для выходного файла.
na_rep string, default '' Отсутствие представления данных
float_format string, default None Строка формата для чисел с плавающей запятой
столбцы последовательность, необязательные столбцы для записи
заголовок boolean или список строк, по умолчанию True Вывести имена столбцов. Если указан список строк, предполагается, что это псевдонимы для имен столбцов
индекс boolean, по умолчанию True Имена строк строк (индекс)
index_label строка или последовательность или False, по умолчанию Нет. Значок столбца для столбца индекса, если требуется. Если задано None, а заголовок и индекс - True, то используются имена индексов. Последовательность должна быть задана, если DataFrame использует MultiIndex. Если False не печатает поля для имен индексов. Используйте index_label = False для упрощения импорта в R
nanRep Ничего не рекомендуется, используйте na_rep
Режим str Python, по умолчанию 'w'
кодирование string, optional Строка, представляющая кодировку, которая будет использоваться в выходном файле, по умолчанию равна «ascii» на Python 2 и «utf-8» на Python 3.
компрессия string, необязательно строка, представляющая сжатие для использования в выходном файле, допустимыми значениями являются «gzip», «bz2», «xz», используется только тогда, когда первый аргумент является именем файла
line_terminator string, default 'n' Символ новой строки или символьная последовательность для использования в выходном файле
квотирование необязательная константа из модуля csv по умолчанию - csv.QUOTE_MINIMAL
QuoteChar string (длина 1), символ по умолчанию '' ', используемый для цитирования полей
двойная кавычка boolean, по умолчанию True Control цитирование катчара внутри поля
escapechar string (длина 1), по умолчанию None используется символ, чтобы избежать sep и quotechar, когда это необходимо
chunksize int или Нет строк для записи одновременно
tupleize_cols boolean, по умолчанию False записывать столбцы multi_index в виде списка кортежей (если True) или нового (расширенный формат), если False)
Формат даты string, default None Строка формата для объектов datetime
десятичный string, default '.' Символ распознается как десятичный разделитель. Например, используйте «,» для европейских данных

Создайте случайный DataFrame и напишите в .csv

Создайте простой DataFrame.

import numpy as np
import pandas as pd

# Set the seed so that the numbers can be reproduced.
np.random.seed(0)  

df = pd.DataFrame(np.random.randn(5, 3), columns=list('ABC'))

# Another way to set column names is "columns=['column_1_name','column_2_name','column_3_name']"

df

      A         B         C
0  1.764052  0.400157  0.978738
1  2.240893  1.867558 -0.977278
2  0.950088 -0.151357 -0.103219
3  0.410599  0.144044  1.454274
4  0.761038  0.121675  0.443863

Теперь напишите CSV-файл:

df.to_csv('example.csv', index=False)

Содержание example.csv:

A,B,C
1.76405234597,0.400157208367,0.978737984106
2.2408931992,1.86755799015,-0.977277879876
0.950088417526,-0.151357208298,-0.103218851794
0.410598501938,0.144043571161,1.45427350696
0.761037725147,0.121675016493,0.443863232745

Обратите внимание, что мы указываем index=False чтобы автоматически сгенерированные индексы (строка #s 0,1,2,3,4) не были включены в файл CSV. Включите его, если вам нужен индексный столбец, например:

df.to_csv('example.csv', index=True)  # Or just leave off the index param; default is True

Содержание example.csv:

,A,B,C
0,1.76405234597,0.400157208367,0.978737984106
1,2.2408931992,1.86755799015,-0.977277879876
2,0.950088417526,-0.151357208298,-0.103218851794
3,0.410598501938,0.144043571161,1.45427350696
4,0.761037725147,0.121675016493,0.443863232745

Также обратите внимание, что вы можете удалить заголовок, если он не нужен с header=False . Это самый простой вывод:

df.to_csv('example.csv', index=False, header=False)

Содержание example.csv:

1.76405234597,0.400157208367,0.978737984106
2.2408931992,1.86755799015,-0.977277879876
0.950088417526,-0.151357208298,-0.103218851794
0.410598501938,0.144043571161,1.45427350696
0.761037725147,0.121675016493,0.443863232745

Разделитель может быть установлен параметром sep= , хотя стандартный разделитель для файлов csv равен ',' .

df.to_csv('example.csv', index=False, header=False, sep='\t')

1.76405234597    0.400157208367    0.978737984106
2.2408931992    1.86755799015    -0.977277879876
0.950088417526    -0.151357208298    -0.103218851794
0.410598501938    0.144043571161    1.45427350696
0.761037725147    0.121675016493    0.443863232745

Сохранить Pandas DataFrame из списка в dicts в csv без индекса и с кодировкой данных

import pandas as pd
data = [
    {'name': 'Daniel', 'country': 'Uganda'},
    {'name': 'Yao', 'country': 'China'},
    {'name': 'James', 'country': 'Colombia'},
]
df = pd.DataFrame(data)
filename = 'people.csv'
df.to_csv(filename, index=False, encoding='utf-8')


Modified text is an extract of the original Stack Overflow Documentation
Лицензировано согласно CC BY-SA 3.0
Не связан с Stack Overflow