수색…


DataFrame에 테이블 읽기

머리글, 바닥 글, 행 이름 및 인덱스 열이있는 테이블 파일 :

파일 : table.txt

This is a header that discusses the table file
to show space in a generic table file

index  name     occupation
1      Alice    Salesman
2      Bob      Engineer
3      Charlie  Janitor  

This is a footer because your boss does not understand data files

암호:

import pandas as pd
# index_col=0 tells pandas that column 0 is the index and not data 
pd.read_table('table.txt', delim_whitespace=True, skiprows=3, skipfooter=2, index_col=0)

산출:

          name occupation
index
1        Alice   Salesman
2          Bob   Engineer
3      Charlie    Janitor

행 이름 또는 색인이없는 표 파일 :

파일 : table.txt

Alice    Salesman
Bob      Engineer
Charlie  Janitor 

암호:

import pandas as pd 
pd.read_table('table.txt', delim_whitespace=True, names=['name','occupation'])

산출:

      name occupation
0    Alice   Salesman
1      Bob   Engineer
2  Charlie    Janitor

모든 옵션은 pandas 문서 에서 찾을 수 있습니다.

CSV 파일 읽기

헤더가있는 데이터 (쉼표 대신 세미콜론으로 구분)

파일 : table.csv

index;name;occupation
1;Alice;Saleswoman
2;Bob;Engineer
3;Charlie;Janitor

암호:

import pandas as pd
pd.read_csv('table.csv', sep=';', index_col=0)

출력 :

          name occupation
index
1        Alice   Salesman
2          Bob   Engineer
3      Charlie    Janitor

구분 기호로 행 이름이나 색인 및 쉼표가없는 테이블

파일 : table.csv

Alice,Saleswoman
Bob,Engineer
Charlie,Janitor

암호:

import pandas as pd 
pd.read_csv('table.csv', names=['name','occupation'])

산출:

      name occupation
0    Alice   Salesman
1      Bob   Engineer
2  Charlie    Janitor

자세한 설명은 read_csv 문서 페이지에서 찾을 수 있습니다.

Google 스프레드 시트 데이터를 팬더 데이터 프레임으로 수집

Google 스프레드 시트에서 데이터를 수집해야하는 경우가 있습니다. gspreadoauth2client 라이브러리를 사용하여 Google 스프레드 시트에서 데이터를 수집 할 수 있습니다. 다음은 데이터를 수집하는 예제입니다.

암호:

from __future__ import print_function
import gspread
from oauth2client.client import SignedJwtAssertionCredentials
import pandas as pd
import json

scope = ['https://spreadsheets.google.com/feeds']

credentials = ServiceAccountCredentials.from_json_keyfile_name('your-authorization-file.json', scope)

gc = gspread.authorize(credentials)

work_sheet = gc.open_by_key("spreadsheet-key-here")
sheet = work_sheet.sheet1
data = pd.DataFrame(sheet.get_all_records()) 

print(data.head())


Modified text is an extract of the original Stack Overflow Documentation
아래 라이선스 CC BY-SA 3.0
와 제휴하지 않음 Stack Overflow