Zoeken…


Een dataframe uit gescheiden scheidingstekens lezen

Misschien wilt u een DataFrame lezen uit een CSV-bestand (door komma's gescheiden waarden) of misschien zelfs uit een TSV- of WSV-bestand (tabs en witruimte gescheiden bestanden). Als uw bestand de juiste extensie heeft, kunt u de readtable functie gebruiken om in het dataframe te lezen:

readtable("dataset.CSV")

Maar wat als uw bestand niet de juiste extensie heeft? U kunt het scheidingsteken opgeven dat uw bestand gebruikt (komma, tab, witruimte, enz.) Als trefwoord voor de functie readtable :

readtable("dataset.txt", separator=',')

Omgaan met verschillende commentaarcommentaar

Gegevenssets bevatten vaak opmerkingen die de gegevensindeling verklaren of de licentie- en gebruiksvoorwaarden bevatten. U wilt deze regels meestal negeren wanneer u in het DataFrame .

De functie van de readtable gaat ervan uit dat commentaarregels beginnen met het teken '#'. Uw bestand kan echter commentaarmerken gebruiken zoals % of // . Om ervoor te zorgen dat de readtable deze correct verwerkt, kunt u het commentaarmerk opgeven als trefwoordargument:

readtable("dataset.csv", allowcomments=true, commentmark='%')


Modified text is an extract of the original Stack Overflow Documentation
Licentie onder CC BY-SA 3.0
Niet aangesloten bij Stack Overflow