pandas => Dateien in Pandas DataFrame lesen

Tabelle in DataFrame lesen

Tabellendatei mit Kopfzeile, Fußzeile, Zeilennamen und Indexspalte:

Datei: table.txt

This is a header that discusses the table file
to show space in a generic table file

index  name     occupation
1      Alice    Salesman
2      Bob      Engineer
3      Charlie  Janitor  

This is a footer because your boss does not understand data files

Code:

import pandas as pd
# index_col=0 tells pandas that column 0 is the index and not data 
pd.read_table('table.txt', delim_whitespace=True, skiprows=3, skipfooter=2, index_col=0)

Ausgabe:

          name occupation
index
1        Alice   Salesman
2          Bob   Engineer
3      Charlie    Janitor

Tabellendatei ohne Zeilennamen oder Index:

Datei: table.txt

Alice    Salesman
Bob      Engineer
Charlie  Janitor

Code:

import pandas as pd 
pd.read_table('table.txt', delim_whitespace=True, names=['name','occupation'])

Ausgabe:

      name occupation
0    Alice   Salesman
1      Bob   Engineer
2  Charlie    Janitor

Alle Optionen können in der Pandas Dokumentation finden hier

CSV-Datei lesen

Daten mit Kopfzeile, durch Semikola anstelle von Kommas getrennt

Datei: table.csv

index;name;occupation
1;Alice;Saleswoman
2;Bob;Engineer
3;Charlie;Janitor

Code:

import pandas as pd
pd.read_csv('table.csv', sep=';', index_col=0)

Ausgabe :

          name occupation
index
1        Alice   Salesman
2          Bob   Engineer
3      Charlie    Janitor

Tabelle ohne Zeilennamen oder Index und Kommas als Trennzeichen

Datei: table.csv

Alice,Saleswoman
Bob,Engineer
Charlie,Janitor

Code:

import pandas as pd 
pd.read_csv('table.csv', names=['name','occupation'])

Ausgabe:

      name occupation
0    Alice   Salesman
1      Bob   Engineer
2  Charlie    Janitor

Weitere read_csv finden Sie auf der read_csv Dokumentationsseite

Sammeln Sie Google-Tabellenkalkulationsdaten in Pandas-Datenrahmen

Manchmal müssen wir Daten von Google-Spreadsheets sammeln. Wir können gspread- und oauth2client- Bibliotheken verwenden, um Daten aus Google-Spreadsheets zu sammeln. Hier ist ein Beispiel zum Sammeln von Daten:

Code:

from __future__ import print_function
import gspread
from oauth2client.client import SignedJwtAssertionCredentials
import pandas as pd
import json

scope = ['https://spreadsheets.google.com/feeds']

credentials = ServiceAccountCredentials.from_json_keyfile_name('your-authorization-file.json', scope)

gc = gspread.authorize(credentials)

work_sheet = gc.open_by_key("spreadsheet-key-here")
sheet = work_sheet.sheet1
data = pd.DataFrame(sheet.get_all_records()) 

print(data.head())

Modified text is an extract of the original Stack Overflow Documentation

Lizenziert unter CC BY-SA 3.0

Nicht angeschlossen an Stack Overflow

pandas
Dateien in Pandas DataFrame lesen

Suche…

Tabelle in DataFrame lesen

Tabellendatei mit Kopfzeile, Fußzeile, Zeilennamen und Indexspalte:

Tabellendatei ohne Zeilennamen oder Index:

CSV-Datei lesen

Daten mit Kopfzeile, durch Semikola anstelle von Kommas getrennt

Tabelle ohne Zeilennamen oder Index und Kommas als Trennzeichen

Sammeln Sie Google-Tabellenkalkulationsdaten in Pandas-Datenrahmen