Szukaj…


Wprowadzenie

Odczytywanie plików tekstowych i wykonywanie na nich operacji.

Przykładowe użycie

Czytaj plik tekstowy ze ścieżki:

val sc: org.apache.spark.SparkContext = ???
sc.textFile(path="/path/to/input/file") 

Czytaj pliki przy użyciu symboli wieloznacznych:

sc.textFile(path="/path/to/*/*") 

Czytaj pliki określające minimalną liczbę partycji:

sc.textFile(path="/path/to/input/file", minPartitions=3)

Połącz dwa pliki odczytane za pomocą textFile ()

Dołącza do Spark:

  • Czytaj tekst Plik 1

    val txt1=sc.textFile(path="/path/to/input/file1") 
    

    Na przykład:

      A B
      1 2
      3 4
    
  • Czytaj plik tekstowy 2

    val txt2=sc.textFile(path="/path/to/input/file2") 
    

    Na przykład:

      A C
      1 5
      3 6
    
  • Dołącz i wydrukuj wynik.

    txt1.join(txt2).foreach(println)
    

    Na przykład:

      A B C
      1 2 5
      3 4 6
    

Połączenie powyżej opiera się na pierwszej kolumnie.



Modified text is an extract of the original Stack Overflow Documentation
Licencjonowany na podstawie CC BY-SA 3.0
Nie związany z Stack Overflow