pandas
Dateien in Pandas DataFrame lesen
Suche…
Tabelle in DataFrame lesen
Tabellendatei mit Kopfzeile, Fußzeile, Zeilennamen und Indexspalte:
Datei: table.txt
This is a header that discusses the table file
to show space in a generic table file
index name occupation
1 Alice Salesman
2 Bob Engineer
3 Charlie Janitor
This is a footer because your boss does not understand data files
Code:
import pandas as pd
# index_col=0 tells pandas that column 0 is the index and not data
pd.read_table('table.txt', delim_whitespace=True, skiprows=3, skipfooter=2, index_col=0)
Ausgabe:
name occupation
index
1 Alice Salesman
2 Bob Engineer
3 Charlie Janitor
Tabellendatei ohne Zeilennamen oder Index:
Datei: table.txt
Alice Salesman
Bob Engineer
Charlie Janitor
Code:
import pandas as pd
pd.read_table('table.txt', delim_whitespace=True, names=['name','occupation'])
Ausgabe:
name occupation
0 Alice Salesman
1 Bob Engineer
2 Charlie Janitor
Alle Optionen können in der Pandas Dokumentation finden hier
CSV-Datei lesen
Daten mit Kopfzeile, durch Semikola anstelle von Kommas getrennt
Datei: table.csv
index;name;occupation
1;Alice;Saleswoman
2;Bob;Engineer
3;Charlie;Janitor
Code:
import pandas as pd
pd.read_csv('table.csv', sep=';', index_col=0)
Ausgabe :
name occupation
index
1 Alice Salesman
2 Bob Engineer
3 Charlie Janitor
Tabelle ohne Zeilennamen oder Index und Kommas als Trennzeichen
Datei: table.csv
Alice,Saleswoman
Bob,Engineer
Charlie,Janitor
Code:
import pandas as pd
pd.read_csv('table.csv', names=['name','occupation'])
Ausgabe:
name occupation
0 Alice Salesman
1 Bob Engineer
2 Charlie Janitor
Weitere read_csv
finden Sie auf der read_csv
Dokumentationsseite
Sammeln Sie Google-Tabellenkalkulationsdaten in Pandas-Datenrahmen
Manchmal müssen wir Daten von Google-Spreadsheets sammeln. Wir können gspread- und oauth2client- Bibliotheken verwenden, um Daten aus Google-Spreadsheets zu sammeln. Hier ist ein Beispiel zum Sammeln von Daten:
Code:
from __future__ import print_function
import gspread
from oauth2client.client import SignedJwtAssertionCredentials
import pandas as pd
import json
scope = ['https://spreadsheets.google.com/feeds']
credentials = ServiceAccountCredentials.from_json_keyfile_name('your-authorization-file.json', scope)
gc = gspread.authorize(credentials)
work_sheet = gc.open_by_key("spreadsheet-key-here")
sheet = work_sheet.sheet1
data = pd.DataFrame(sheet.get_all_records())
print(data.head())
Modified text is an extract of the original Stack Overflow Documentation
Lizenziert unter CC BY-SA 3.0
Nicht angeschlossen an Stack Overflow