Ricerca…


introduzione

Lettura di file di testo e esecuzione di operazioni su di essi.

Esempio di utilizzo

Leggi il file di testo dal percorso:

val sc: org.apache.spark.SparkContext = ???
sc.textFile(path="/path/to/input/file") 

Leggi i file usando i caratteri jolly:

sc.textFile(path="/path/to/*/*") 

Leggi i file specificando il numero minimo di partizioni:

sc.textFile(path="/path/to/input/file", minPartitions=3)

Unisci due file letti con textFile ()

Join in Spark:

  • Leggi il file di testo 1

    val txt1=sc.textFile(path="/path/to/input/file1") 
    

    Per esempio:

      A B
      1 2
      3 4
    
  • Leggi il testo File 2

    val txt2=sc.textFile(path="/path/to/input/file2") 
    

    Per esempio:

      A C
      1 5
      3 6
    
  • Iscriviti e stampa il risultato.

    txt1.join(txt2).foreach(println)
    

    Per esempio:

      A B C
      1 2 5
      3 4 6
    

Il join sopra è basato sulla prima colonna.



Modified text is an extract of the original Stack Overflow Documentation
Autorizzato sotto CC BY-SA 3.0
Non affiliato con Stack Overflow