Julia Language
Een DataFrame uit een bestand lezen
Zoeken…
Een dataframe uit gescheiden scheidingstekens lezen
Misschien wilt u een DataFrame lezen uit een CSV-bestand (door komma's gescheiden waarden) of misschien zelfs uit een TSV- of WSV-bestand (tabs en witruimte gescheiden bestanden). Als uw bestand de juiste extensie heeft, kunt u de readtable functie gebruiken om in het dataframe te lezen:
readtable("dataset.CSV")
Maar wat als uw bestand niet de juiste extensie heeft? U kunt het scheidingsteken opgeven dat uw bestand gebruikt (komma, tab, witruimte, enz.) Als trefwoord voor de functie readtable :
readtable("dataset.txt", separator=',')
Omgaan met verschillende commentaarcommentaar
Gegevenssets bevatten vaak opmerkingen die de gegevensindeling verklaren of de licentie- en gebruiksvoorwaarden bevatten. U wilt deze regels meestal negeren wanneer u in het DataFrame .
De functie van de readtable gaat ervan uit dat commentaarregels beginnen met het teken '#'. Uw bestand kan echter commentaarmerken gebruiken zoals % of // . Om ervoor te zorgen dat de readtable deze correct verwerkt, kunt u het commentaarmerk opgeven als trefwoordargument:
readtable("dataset.csv", allowcomments=true, commentmark='%')