Julia Language
Een DataFrame uit een bestand lezen
Zoeken…
Een dataframe uit gescheiden scheidingstekens lezen
Misschien wilt u een DataFrame
lezen uit een CSV-bestand (door komma's gescheiden waarden) of misschien zelfs uit een TSV- of WSV-bestand (tabs en witruimte gescheiden bestanden). Als uw bestand de juiste extensie heeft, kunt u de readtable
functie gebruiken om in het dataframe te lezen:
readtable("dataset.CSV")
Maar wat als uw bestand niet de juiste extensie heeft? U kunt het scheidingsteken opgeven dat uw bestand gebruikt (komma, tab, witruimte, enz.) Als trefwoord voor de functie readtable
:
readtable("dataset.txt", separator=',')
Omgaan met verschillende commentaarcommentaar
Gegevenssets bevatten vaak opmerkingen die de gegevensindeling verklaren of de licentie- en gebruiksvoorwaarden bevatten. U wilt deze regels meestal negeren wanneer u in het DataFrame
.
De functie van de readtable
gaat ervan uit dat commentaarregels beginnen met het teken '#'. Uw bestand kan echter commentaarmerken gebruiken zoals %
of //
. Om ervoor te zorgen dat de readtable
deze correct verwerkt, kunt u het commentaarmerk opgeven als trefwoordargument:
readtable("dataset.csv", allowcomments=true, commentmark='%')