Buscar..


Lectura de un marco de datos a partir de datos separados por delimitadores

Es posible que desee leer un DataFrame de un archivo CSV (valores separados por comas) o incluso de un TSV o WSV (pestañas y archivos separados por espacios en blanco). Si el archivo tiene la extensión correcta, puede usar el readtable función para leer en la trama de datos:

readtable("dataset.CSV")

¿Pero qué pasa si su archivo no tiene la extensión correcta? Puede especificar el delimitador que utiliza su archivo (coma, tabulación, espacios en blanco, etc.) como un argumento de palabra clave para la función de readtable :

readtable("dataset.txt", separator=',')

Manejo de diferentes comentarios comentario marcas.

Los conjuntos de datos a menudo contienen comentarios que explican el formato de los datos o contienen los términos de licencia y uso. Por lo general, querrá ignorar estas líneas cuando lea en el DataFrame .

La función de readtable asume que las líneas de comentario comienzan con el carácter '#'. Sin embargo, su archivo puede usar marcas de comentario como % o // . Para asegurarse de que readtable maneja esto correctamente, puede especificar la marca de comentario como un argumento de palabra clave:

readtable("dataset.csv", allowcomments=true, commentmark='%')


Modified text is an extract of the original Stack Overflow Documentation
Licenciado bajo CC BY-SA 3.0
No afiliado a Stack Overflow