Julia Language
Lesen eines DataFrame aus einer Datei
Suche…
Lesen eines Datenrahmens aus durch Trennzeichen getrennten Daten
Sie können einen DataFrame
aus einer CSV-Datei (durch DataFrame
getrennte Werte) oder sogar aus einem TSV oder WSV (durch Tabulatoren und Leerzeichen getrennte Dateien) lesen. Wenn Ihre Datei die richtige Erweiterung hat, können Sie die readtable
Funktion verwenden, um den Datenrahmen einzulesen:
readtable("dataset.CSV")
Was ist, wenn Ihre Datei nicht die richtige Erweiterung hat? Sie können das von Ihrer Datei verwendete Trennzeichen (Komma, Tabulator, Leerzeichen usw.) als Schlüsselwortargument für die Funktion readtable
:
readtable("dataset.txt", separator=',')
Umgang mit verschiedenen Kommentarkennzeichen
Datensätze enthalten häufig Kommentare, die das Datenformat erläutern oder die Lizenz- und Nutzungsbedingungen enthalten. Normalerweise möchten Sie diese Zeilen ignorieren, wenn Sie den DataFrame
.
Die Funktion readtable
geht davon aus, dass Kommentarzeilen mit dem Zeichen '#' beginnen. Ihre Datei kann jedoch Kommentarzeichen wie %
oder //
. Um sicherzustellen, dass readtable
diese korrekt verarbeitet, können Sie die Kommentarmarke als Schlüsselwortargument angeben:
readtable("dataset.csv", allowcomments=true, commentmark='%')