pandas => 팬더 데이터 프레임을 CSV 파일로 저장

매개 변수

매개 변수	기술
path_or_buf	문자열 또는 파일 핸들, 기본 없음 파일 경로 또는 객체, None이 제공되면 결과는 문자열로 반환됩니다.
끊다	character, default ','출력 파일의 필드 구분 기호.
na_rep	문자열, 기본값 ''누락 된 데이터 표현
float_format	string, default None 부동 소수점 숫자의 형식 문자열
기둥	sequence, optional 기입하는 열
머리글	부울 또는 문자열 목록, 기본값 True 열 이름을 작성합니다. 문자열 목록이 제공되면 열 이름의 별명으로 간주됩니다
색인	boolean, default True 행 이름 쓰기 (색인)
index_label	문자열 또는 시퀀스 또는 False, 기본값 없음 원하는 경우 인덱스 열의 열 레이블. None을 지정하고 header와 index가 True이면 색인 이름이 사용됩니다. DataFrame이 MultiIndex를 사용하면 시퀀스를 지정해야합니다. False이면 색인 이름의 필드를 인쇄하지 않습니다. R에서 쉽게 가져 오기 위해 index_label = False를 사용하십시오.
nanRep	더 이상 지원되지 않으며, na_rep을 사용합니다.
방법	str 파이썬 쓰기 모드, 기본값은 'w'
부호화	string, optional 출력 파일에 사용할 인코딩을 나타내는 문자열입니다. 기본값은 Python 2에서는 'ascii'이고 Python 3에서는 'utf-8'입니다.
압축	string, optional 출력 파일에서 사용할 압축을 나타내는 문자열. 허용되는 값은 'gzip', 'bz2', 'xz'이며 첫 번째 인수가 파일 이름 일 때만 사용됩니다.
line_terminator	string, default 'n'출력 파일에 사용할 개행 문자 또는 문자 시퀀스입니다.
인용	csv 모듈의 선택적 상수 기본값은 csv.QUOTE_MINIMAL입니다.
quotechar	문자열 (길이 1), 기본값 "" '필드를 인용 부호로 사용하는 문자
큰 따옴표	부울, 기본 True Control 필드 내에서 quotechar의 인용
이스케이프 문자	문자열 (길이 1), 기본값 없음 적절한 경우 sep 및 quotechar를 이스케이프 처리하는 데 사용되는 문자입니다.
덩어리로 만들다	한 번에 쓸 int 또는 None 행
tupleize_cols	부울 값, 기본값 False이면 다중 열의 목록을 터플 목록 (True 일 경우) 또는 새로 만들 경우 (확장 된 형식) False 일 경우 쓰기
날짜 형식	string, default 없음 datetime 객체의 형식 문자열
소수	문자열, 기본 '.' 소수점 구분 기호로 인식되는 문자입니다. 예 : 유럽 데이터의 경우 ','사용

임의의 DataFrame을 만들고 .csv에 씁니다.

간단한 DataFrame을 만듭니다.

import numpy as np
import pandas as pd

# Set the seed so that the numbers can be reproduced.
np.random.seed(0)  

df = pd.DataFrame(np.random.randn(5, 3), columns=list('ABC'))

# Another way to set column names is "columns=['column_1_name','column_2_name','column_3_name']"

df

      A         B         C
0  1.764052  0.400157  0.978738
1  2.240893  1.867558 -0.977278
2  0.950088 -0.151357 -0.103219
3  0.410599  0.144044  1.454274
4  0.761038  0.121675  0.443863

이제 CSV 파일에 작성하십시오.

df.to_csv('example.csv', index=False)

example.csv의 내용 :

A,B,C
1.76405234597,0.400157208367,0.978737984106
2.2408931992,1.86755799015,-0.977277879876
0.950088417526,-0.151357208298,-0.103218851794
0.410598501938,0.144043571161,1.45427350696
0.761037725147,0.121675016493,0.443863232745

자동 생성 색인 (행 #s 0,1,2,3,4)이 CSV 파일에 포함되지 않도록 index=False 지정합니다. 다음과 같이 인덱스 열이 필요한 경우 포함하십시오.

df.to_csv('example.csv', index=True)  # Or just leave off the index param; default is True

example.csv의 내용 :

,A,B,C
0,1.76405234597,0.400157208367,0.978737984106
1,2.2408931992,1.86755799015,-0.977277879876
2,0.950088417526,-0.151357208298,-0.103218851794
3,0.410598501938,0.144043571161,1.45427350696
4,0.761037725147,0.121675016493,0.443863232745

header=False 와 함께 필요하지 않은 경우 헤더를 제거 할 수 있습니다. 이것은 가장 간단한 출력입니다.

df.to_csv('example.csv', index=False, header=False)

example.csv의 내용 :

1.76405234597,0.400157208367,0.978737984106
2.2408931992,1.86755799015,-0.977277879876
0.950088417526,-0.151357208298,-0.103218851794
0.410598501938,0.144043571161,1.45427350696
0.761037725147,0.121675016493,0.443863232745

구분 기호는 sep= argument로 설정할 수 있지만 csv 파일의 표준 구분 기호는 ',' 입니다.

df.to_csv('example.csv', index=False, header=False, sep='\t')

1.76405234597    0.400157208367    0.978737984106
2.2408931992    1.86755799015    -0.977277879876
0.950088417526    -0.151357208298    -0.103218851794
0.410598501938    0.144043571161    1.45427350696
0.761037725147    0.121675016493    0.443863232745

목록에서 팬더 DataFrame을 저장하여 인덱스가없고 데이터 인코딩이있는 csv를 지정합니다.

import pandas as pd
data = [
    {'name': 'Daniel', 'country': 'Uganda'},
    {'name': 'Yao', 'country': 'China'},
    {'name': 'James', 'country': 'Colombia'},
]
df = pd.DataFrame(data)
filename = 'people.csv'
df.to_csv(filename, index=False, encoding='utf-8')

Modified text is an extract of the original Stack Overflow Documentation

아래 라이선스 CC BY-SA 3.0

와 제휴하지 않음 Stack Overflow

pandas
팬더 데이터 프레임을 CSV 파일로 저장

수색…

매개 변수

임의의 DataFrame을 만들고 .csv에 씁니다.

목록에서 팬더 DataFrame을 저장하여 인덱스가없고 데이터 인코딩이있는 csv를 지정합니다.