Szukaj…


Odczytywanie ramki danych z danych oddzielonych separatorem

Możesz odczytać DataFrame z pliku CSV (wartości oddzielone przecinkami), a może nawet z pliku TSV lub WSV (pliki oddzielone tabulatorami i spacjami). Jeśli plik ma odpowiednie rozszerzenie, można użyć readtable funkcji do odczytu w dataframe:

readtable("dataset.CSV")

Ale co jeśli twój plik nie ma właściwego rozszerzenia? Możesz określić separator, którego używa twój plik (przecinek, tabulator, białe znaki itp.) Jako argument słowa kluczowego dla funkcji readtable do readtable :

readtable("dataset.txt", separator=',')

Obsługa różnych znaków komentarza do komentarza

Zestawy danych często zawierają komentarze wyjaśniające format danych lub warunki licencji i użytkowania. Zazwyczaj chcesz zignorować te wiersze podczas odczytu w DataFrame .

Funkcja do readtable zakłada, że linie komentarza zaczynają się od znaku „#”. Twój plik może jednak używać znaków komentarza, takich jak % lub // . Aby upewnić się, że możliwe do readtable poprawnie je obsługuje, możesz podać znak komentarza jako argument słowa kluczowego:

readtable("dataset.csv", allowcomments=true, commentmark='%')


Modified text is an extract of the original Stack Overflow Documentation
Licencjonowany na podstawie CC BY-SA 3.0
Nie związany z Stack Overflow