Buscar..


Parámetros

Parámetro Descripción
path_or_buf cadena o identificador de archivo, por defecto Ninguno Ruta de archivo de archivo u objeto, si se proporciona Ninguno, el resultado se devuelve como una cadena.
sep carácter, predeterminado ',' delimitador de campo para el archivo de salida.
na_rep cadena, por defecto '' Representación de datos faltantes
float_format cadena, por defecto Ninguno Cadena de formato para números de punto flotante
columnas Secuencias, columnas opcionales para escribir.
encabezamiento booleano o lista de cadenas, nombres de columna de escritura verdadera predeterminados. Si se proporciona una lista de cadenas, se asume que son alias para los nombres de columna
índice booleano, nombres de fila de escritura verdadera predeterminados (índice)
index_label cadena o secuencia, o Falso, predeterminado Ninguno Etiqueta de columna para columnas de índice, si lo desea. Si se da Ninguno, y el encabezado y el índice son Verdaderos, entonces se usan los nombres del índice. Se debe dar una secuencia si el DataFrame usa MultiIndex. Si es falso, no imprima campos para los nombres de índice. Use index_label = False para facilitar la importación en R
nanRep Ninguno en desuso, use na_rep
modo modo de escritura str Python, por defecto 'w'
codificación cadena, opcional Una cadena que representa la codificación a usar en el archivo de salida, por defecto es 'ascii' en Python 2 y 'utf-8' en Python 3.
compresión cadena, opcional una cadena que representa la compresión a usar en el archivo de salida, los valores permitidos son 'gzip', 'bz2', 'xz', solo se usan cuando el primer argumento es un nombre de archivo
line_terminator cadena, por defecto 'n' El carácter de nueva línea o secuencia de caracteres para usar en el archivo de salida
citando constante opcional del módulo csv por defecto a csv.QUOTE_MINIMAL
cotizar cadena (longitud 1), por defecto el carácter '' 'usado para citar campos
doble cita booleano, cotización True Control por defecto de quotechar dentro de un campo
escapechar cadena (longitud 1), por defecto Ninguno carácter utilizado para escapar de sep y quotechar cuando sea apropiado
tamaño de porción Int o None filas para escribir a la vez
tupleize_cols booleano, predeterminado False escribe columnas multi_index como una lista de tuplas (si es verdadero) o nuevo (formato expandido) si es falso)
formato de fecha cadena, por defecto Ninguno Cadena de formato para objetos de fecha y hora
decimal cadena, por defecto '.' Carácter reconocido como separador decimal. Por ejemplo, use ',' para datos europeos

Crear un marco de datos aleatorio y escribir en .csv

Crear un DataFrame simple.

import numpy as np
import pandas as pd

# Set the seed so that the numbers can be reproduced.
np.random.seed(0)  

df = pd.DataFrame(np.random.randn(5, 3), columns=list('ABC'))

# Another way to set column names is "columns=['column_1_name','column_2_name','column_3_name']"

df

      A         B         C
0  1.764052  0.400157  0.978738
1  2.240893  1.867558 -0.977278
2  0.950088 -0.151357 -0.103219
3  0.410599  0.144044  1.454274
4  0.761038  0.121675  0.443863

Ahora, escribe en un archivo CSV:

df.to_csv('example.csv', index=False)

Contenido de example.csv:

A,B,C
1.76405234597,0.400157208367,0.978737984106
2.2408931992,1.86755799015,-0.977277879876
0.950088417526,-0.151357208298,-0.103218851794
0.410598501938,0.144043571161,1.45427350696
0.761037725147,0.121675016493,0.443863232745

Tenga en cuenta que especificamos index=False para que los índices generados automáticamente (fila #s 0,1,2,3,4) no se incluyan en el archivo CSV. Inclúyelo si necesita la columna de índice, así:

df.to_csv('example.csv', index=True)  # Or just leave off the index param; default is True

Contenido de example.csv:

,A,B,C
0,1.76405234597,0.400157208367,0.978737984106
1,2.2408931992,1.86755799015,-0.977277879876
2,0.950088417526,-0.151357208298,-0.103218851794
3,0.410598501938,0.144043571161,1.45427350696
4,0.761037725147,0.121675016493,0.443863232745

También tenga en cuenta que puede eliminar el encabezado si no es necesario con header=False . Esta es la salida más simple:

df.to_csv('example.csv', index=False, header=False)

Contenido de example.csv:

1.76405234597,0.400157208367,0.978737984106
2.2408931992,1.86755799015,-0.977277879876
0.950088417526,-0.151357208298,-0.103218851794
0.410598501938,0.144043571161,1.45427350696
0.761037725147,0.121675016493,0.443863232745

El delimitador se puede establecer por sep= argumento, aunque el separador estándar para archivos csv es ',' .

df.to_csv('example.csv', index=False, header=False, sep='\t')

1.76405234597    0.400157208367    0.978737984106
2.2408931992    1.86755799015    -0.977277879876
0.950088417526    -0.151357208298    -0.103218851794
0.410598501938    0.144043571161    1.45427350696
0.761037725147    0.121675016493    0.443863232745

Guarde Pandas DataFrame de la lista a los dictados a CSV sin índice y con codificación de datos

import pandas as pd
data = [
    {'name': 'Daniel', 'country': 'Uganda'},
    {'name': 'Yao', 'country': 'China'},
    {'name': 'James', 'country': 'Colombia'},
]
df = pd.DataFrame(data)
filename = 'people.csv'
df.to_csv(filename, index=False, encoding='utf-8')


Modified text is an extract of the original Stack Overflow Documentation
Licenciado bajo CC BY-SA 3.0
No afiliado a Stack Overflow