pandas
Guardar pandas dataframe en un archivo csv
Buscar..
Parámetros
Parámetro | Descripción |
---|---|
path_or_buf | cadena o identificador de archivo, por defecto Ninguno Ruta de archivo de archivo u objeto, si se proporciona Ninguno, el resultado se devuelve como una cadena. |
sep | carácter, predeterminado ',' delimitador de campo para el archivo de salida. |
na_rep | cadena, por defecto '' Representación de datos faltantes |
float_format | cadena, por defecto Ninguno Cadena de formato para números de punto flotante |
columnas | Secuencias, columnas opcionales para escribir. |
encabezamiento | booleano o lista de cadenas, nombres de columna de escritura verdadera predeterminados. Si se proporciona una lista de cadenas, se asume que son alias para los nombres de columna |
índice | booleano, nombres de fila de escritura verdadera predeterminados (índice) |
index_label | cadena o secuencia, o Falso, predeterminado Ninguno Etiqueta de columna para columnas de índice, si lo desea. Si se da Ninguno, y el encabezado y el índice son Verdaderos, entonces se usan los nombres del índice. Se debe dar una secuencia si el DataFrame usa MultiIndex. Si es falso, no imprima campos para los nombres de índice. Use index_label = False para facilitar la importación en R |
nanRep | Ninguno en desuso, use na_rep |
modo | modo de escritura str Python, por defecto 'w' |
codificación | cadena, opcional Una cadena que representa la codificación a usar en el archivo de salida, por defecto es 'ascii' en Python 2 y 'utf-8' en Python 3. |
compresión | cadena, opcional una cadena que representa la compresión a usar en el archivo de salida, los valores permitidos son 'gzip', 'bz2', 'xz', solo se usan cuando el primer argumento es un nombre de archivo |
line_terminator | cadena, por defecto 'n' El carácter de nueva línea o secuencia de caracteres para usar en el archivo de salida |
citando | constante opcional del módulo csv por defecto a csv.QUOTE_MINIMAL |
cotizar | cadena (longitud 1), por defecto el carácter '' 'usado para citar campos |
doble cita | booleano, cotización True Control por defecto de quotechar dentro de un campo |
escapechar | cadena (longitud 1), por defecto Ninguno carácter utilizado para escapar de sep y quotechar cuando sea apropiado |
tamaño de porción | Int o None filas para escribir a la vez |
tupleize_cols | booleano, predeterminado False escribe columnas multi_index como una lista de tuplas (si es verdadero) o nuevo (formato expandido) si es falso) |
formato de fecha | cadena, por defecto Ninguno Cadena de formato para objetos de fecha y hora |
decimal | cadena, por defecto '.' Carácter reconocido como separador decimal. Por ejemplo, use ',' para datos europeos |
Crear un marco de datos aleatorio y escribir en .csv
Crear un DataFrame simple.
import numpy as np
import pandas as pd
# Set the seed so that the numbers can be reproduced.
np.random.seed(0)
df = pd.DataFrame(np.random.randn(5, 3), columns=list('ABC'))
# Another way to set column names is "columns=['column_1_name','column_2_name','column_3_name']"
df
A B C
0 1.764052 0.400157 0.978738
1 2.240893 1.867558 -0.977278
2 0.950088 -0.151357 -0.103219
3 0.410599 0.144044 1.454274
4 0.761038 0.121675 0.443863
Ahora, escribe en un archivo CSV:
df.to_csv('example.csv', index=False)
Contenido de example.csv:
A,B,C
1.76405234597,0.400157208367,0.978737984106
2.2408931992,1.86755799015,-0.977277879876
0.950088417526,-0.151357208298,-0.103218851794
0.410598501938,0.144043571161,1.45427350696
0.761037725147,0.121675016493,0.443863232745
Tenga en cuenta que especificamos index=False
para que los índices generados automáticamente (fila #s 0,1,2,3,4) no se incluyan en el archivo CSV. Inclúyelo si necesita la columna de índice, así:
df.to_csv('example.csv', index=True) # Or just leave off the index param; default is True
Contenido de example.csv:
,A,B,C
0,1.76405234597,0.400157208367,0.978737984106
1,2.2408931992,1.86755799015,-0.977277879876
2,0.950088417526,-0.151357208298,-0.103218851794
3,0.410598501938,0.144043571161,1.45427350696
4,0.761037725147,0.121675016493,0.443863232745
También tenga en cuenta que puede eliminar el encabezado si no es necesario con header=False
. Esta es la salida más simple:
df.to_csv('example.csv', index=False, header=False)
Contenido de example.csv:
1.76405234597,0.400157208367,0.978737984106
2.2408931992,1.86755799015,-0.977277879876
0.950088417526,-0.151357208298,-0.103218851794
0.410598501938,0.144043571161,1.45427350696
0.761037725147,0.121675016493,0.443863232745
El delimitador se puede establecer por sep=
argumento, aunque el separador estándar para archivos csv es ','
.
df.to_csv('example.csv', index=False, header=False, sep='\t')
1.76405234597 0.400157208367 0.978737984106
2.2408931992 1.86755799015 -0.977277879876
0.950088417526 -0.151357208298 -0.103218851794
0.410598501938 0.144043571161 1.45427350696
0.761037725147 0.121675016493 0.443863232745
Guarde Pandas DataFrame de la lista a los dictados a CSV sin índice y con codificación de datos
import pandas as pd
data = [
{'name': 'Daniel', 'country': 'Uganda'},
{'name': 'Yao', 'country': 'China'},
{'name': 'James', 'country': 'Colombia'},
]
df = pd.DataFrame(data)
filename = 'people.csv'
df.to_csv(filename, index=False, encoding='utf-8')
Modified text is an extract of the original Stack Overflow Documentation
Licenciado bajo CC BY-SA 3.0
No afiliado a Stack Overflow