apache-spark
Fichiers texte et opérations à Scala
Recherche…
Introduction
Lire des fichiers texte et effectuer des opérations sur eux.
Exemple d'utilisation
Lire le fichier texte du chemin:
val sc: org.apache.spark.SparkContext = ???
sc.textFile(path="/path/to/input/file")
Lire des fichiers en utilisant des caractères génériques:
sc.textFile(path="/path/to/*/*")
Lire des fichiers en spécifiant un nombre minimum de partitions:
sc.textFile(path="/path/to/input/file", minPartitions=3)
Joindre deux fichiers lus avec textFile ()
Se joint à Spark:
Lire le texteFichier 1
val txt1=sc.textFile(path="/path/to/input/file1")
Par exemple:
A B 1 2 3 4
Lire le texteFichier 2
val txt2=sc.textFile(path="/path/to/input/file2")
Par exemple:
A C 1 5 3 6
Joindre et imprimer le résultat.
txt1.join(txt2).foreach(println)
Par exemple:
A B C 1 2 5 3 4 6
La jointure ci-dessus est basée sur la première colonne.
Modified text is an extract of the original Stack Overflow Documentation
Sous licence CC BY-SA 3.0
Non affilié à Stack Overflow