pandas
Сохраните файл данных pandas в файл csv
Поиск…
параметры
параметр | Описание |
---|---|
path_or_buf | string или file handle, по умолчанию None Путь к файлу или объект, если None предоставлен, результат возвращается как строка. |
сентябрь | character, default ',' Разделитель полей для выходного файла. |
na_rep | string, default '' Отсутствие представления данных |
float_format | string, default None Строка формата для чисел с плавающей запятой |
столбцы | последовательность, необязательные столбцы для записи |
заголовок | boolean или список строк, по умолчанию True Вывести имена столбцов. Если указан список строк, предполагается, что это псевдонимы для имен столбцов |
индекс | boolean, по умолчанию True Имена строк строк (индекс) |
index_label | строка или последовательность или False, по умолчанию Нет. Значок столбца для столбца индекса, если требуется. Если задано None, а заголовок и индекс - True, то используются имена индексов. Последовательность должна быть задана, если DataFrame использует MultiIndex. Если False не печатает поля для имен индексов. Используйте index_label = False для упрощения импорта в R |
nanRep | Ничего не рекомендуется, используйте na_rep |
Режим | str Python, по умолчанию 'w' |
кодирование | string, optional Строка, представляющая кодировку, которая будет использоваться в выходном файле, по умолчанию равна «ascii» на Python 2 и «utf-8» на Python 3. |
компрессия | string, необязательно строка, представляющая сжатие для использования в выходном файле, допустимыми значениями являются «gzip», «bz2», «xz», используется только тогда, когда первый аргумент является именем файла |
line_terminator | string, default 'n' Символ новой строки или символьная последовательность для использования в выходном файле |
квотирование | необязательная константа из модуля csv по умолчанию - csv.QUOTE_MINIMAL |
QuoteChar | string (длина 1), символ по умолчанию '' ', используемый для цитирования полей |
двойная кавычка | boolean, по умолчанию True Control цитирование катчара внутри поля |
escapechar | string (длина 1), по умолчанию None используется символ, чтобы избежать sep и quotechar, когда это необходимо |
chunksize | int или Нет строк для записи одновременно |
tupleize_cols | boolean, по умолчанию False записывать столбцы multi_index в виде списка кортежей (если True) или нового (расширенный формат), если False) |
Формат даты | string, default None Строка формата для объектов datetime |
десятичный | string, default '.' Символ распознается как десятичный разделитель. Например, используйте «,» для европейских данных |
Создайте случайный DataFrame и напишите в .csv
Создайте простой DataFrame.
import numpy as np
import pandas as pd
# Set the seed so that the numbers can be reproduced.
np.random.seed(0)
df = pd.DataFrame(np.random.randn(5, 3), columns=list('ABC'))
# Another way to set column names is "columns=['column_1_name','column_2_name','column_3_name']"
df
A B C
0 1.764052 0.400157 0.978738
1 2.240893 1.867558 -0.977278
2 0.950088 -0.151357 -0.103219
3 0.410599 0.144044 1.454274
4 0.761038 0.121675 0.443863
Теперь напишите CSV-файл:
df.to_csv('example.csv', index=False)
Содержание example.csv:
A,B,C
1.76405234597,0.400157208367,0.978737984106
2.2408931992,1.86755799015,-0.977277879876
0.950088417526,-0.151357208298,-0.103218851794
0.410598501938,0.144043571161,1.45427350696
0.761037725147,0.121675016493,0.443863232745
Обратите внимание, что мы указываем index=False
чтобы автоматически сгенерированные индексы (строка #s 0,1,2,3,4) не были включены в файл CSV. Включите его, если вам нужен индексный столбец, например:
df.to_csv('example.csv', index=True) # Or just leave off the index param; default is True
Содержание example.csv:
,A,B,C
0,1.76405234597,0.400157208367,0.978737984106
1,2.2408931992,1.86755799015,-0.977277879876
2,0.950088417526,-0.151357208298,-0.103218851794
3,0.410598501938,0.144043571161,1.45427350696
4,0.761037725147,0.121675016493,0.443863232745
Также обратите внимание, что вы можете удалить заголовок, если он не нужен с header=False
. Это самый простой вывод:
df.to_csv('example.csv', index=False, header=False)
Содержание example.csv:
1.76405234597,0.400157208367,0.978737984106
2.2408931992,1.86755799015,-0.977277879876
0.950088417526,-0.151357208298,-0.103218851794
0.410598501938,0.144043571161,1.45427350696
0.761037725147,0.121675016493,0.443863232745
Разделитель может быть установлен параметром sep=
, хотя стандартный разделитель для файлов csv равен ','
.
df.to_csv('example.csv', index=False, header=False, sep='\t')
1.76405234597 0.400157208367 0.978737984106
2.2408931992 1.86755799015 -0.977277879876
0.950088417526 -0.151357208298 -0.103218851794
0.410598501938 0.144043571161 1.45427350696
0.761037725147 0.121675016493 0.443863232745
Сохранить Pandas DataFrame из списка в dicts в csv без индекса и с кодировкой данных
import pandas as pd
data = [
{'name': 'Daniel', 'country': 'Uganda'},
{'name': 'Yao', 'country': 'China'},
{'name': 'James', 'country': 'Colombia'},
]
df = pd.DataFrame(data)
filename = 'people.csv'
df.to_csv(filename, index=False, encoding='utf-8')
Modified text is an extract of the original Stack Overflow Documentation
Лицензировано согласно CC BY-SA 3.0
Не связан с Stack Overflow