Recherche…


Lecture d'un dataframe à partir de données séparées par un délimiteur

Vous souhaiterez peut-être lire un DataFrame partir d'un fichier CSV (valeurs séparées par des virgules) ou peut-être même d'un fichier TSV ou WSV (fichiers séparés par des tabulations et des espaces). Si votre fichier a la bonne extension, vous pouvez utiliser la fonction readtable pour lire dans le dataframe:

readtable("dataset.CSV")

Mais que faire si votre fichier n'a pas la bonne extension? Vous pouvez spécifier le délimiteur utilisé par votre fichier (virgule, tabulation, espace, etc.) comme argument de mot-clé de la fonction readtable :

readtable("dataset.txt", separator=',')

Gestion des différents commentaires de commentaire

Les ensembles de données contiennent souvent des commentaires expliquant le format des données ou contenant les termes de la licence et de l'utilisation. Vous souhaitez généralement ignorer ces lignes lorsque vous lisez dans le DataFrame .

La fonction readtable suppose que les lignes de commentaires commencent par le caractère '#'. Cependant, votre fichier peut utiliser des marques de commentaires comme % ou // . Pour vous assurer que readtable gère correctement, vous pouvez spécifier la marque de commentaire comme argument de mot clé:

readtable("dataset.csv", allowcomments=true, commentmark='%')


Modified text is an extract of the original Stack Overflow Documentation
Sous licence CC BY-SA 3.0
Non affilié à Stack Overflow