Julia Language
Odczytywanie DataFrame z pliku
Szukaj…
Odczytywanie ramki danych z danych oddzielonych separatorem
Możesz odczytać DataFrame
z pliku CSV (wartości oddzielone przecinkami), a może nawet z pliku TSV lub WSV (pliki oddzielone tabulatorami i spacjami). Jeśli plik ma odpowiednie rozszerzenie, można użyć readtable
funkcji do odczytu w dataframe:
readtable("dataset.CSV")
Ale co jeśli twój plik nie ma właściwego rozszerzenia? Możesz określić separator, którego używa twój plik (przecinek, tabulator, białe znaki itp.) Jako argument słowa kluczowego dla funkcji readtable
do readtable
:
readtable("dataset.txt", separator=',')
Obsługa różnych znaków komentarza do komentarza
Zestawy danych często zawierają komentarze wyjaśniające format danych lub warunki licencji i użytkowania. Zazwyczaj chcesz zignorować te wiersze podczas odczytu w DataFrame
.
Funkcja do readtable
zakłada, że linie komentarza zaczynają się od znaku „#”. Twój plik może jednak używać znaków komentarza, takich jak %
lub //
. Aby upewnić się, że możliwe do readtable
poprawnie je obsługuje, możesz podać znak komentarza jako argument słowa kluczowego:
readtable("dataset.csv", allowcomments=true, commentmark='%')