Julia Language
Lire un DataFrame à partir d'un fichier
Recherche…
Lecture d'un dataframe à partir de données séparées par un délimiteur
Vous souhaiterez peut-être lire un DataFrame
partir d'un fichier CSV (valeurs séparées par des virgules) ou peut-être même d'un fichier TSV ou WSV (fichiers séparés par des tabulations et des espaces). Si votre fichier a la bonne extension, vous pouvez utiliser la fonction readtable
pour lire dans le dataframe:
readtable("dataset.CSV")
Mais que faire si votre fichier n'a pas la bonne extension? Vous pouvez spécifier le délimiteur utilisé par votre fichier (virgule, tabulation, espace, etc.) comme argument de mot-clé de la fonction readtable
:
readtable("dataset.txt", separator=',')
Gestion des différents commentaires de commentaire
Les ensembles de données contiennent souvent des commentaires expliquant le format des données ou contenant les termes de la licence et de l'utilisation. Vous souhaitez généralement ignorer ces lignes lorsque vous lisez dans le DataFrame
.
La fonction readtable
suppose que les lignes de commentaires commencent par le caractère '#'. Cependant, votre fichier peut utiliser des marques de commentaires comme %
ou //
. Pour vous assurer que readtable
gère correctement, vous pouvez spécifier la marque de commentaire comme argument de mot clé:
readtable("dataset.csv", allowcomments=true, commentmark='%')