apache-spark
Scalaのテキストファイルと操作
サーチ…
前書き
テキストファイルを読み込んで操作します。
使用例
パスからテキストファイルを読み込む:
val sc: org.apache.spark.SparkContext = ???
sc.textFile(path="/path/to/input/file")
ワイルドカードを使ってファイルを読む:
sc.textFile(path="/path/to/*/*")
最小限のパーティション数を指定してファイルを読み込みます。
sc.textFile(path="/path/to/input/file", minPartitions=3)
textFile()で読み込まれた2つのファイルを結合する
スパークの結合:
テキストファイル1を読む
val txt1=sc.textFile(path="/path/to/input/file1")
例えば:
A B 1 2 3 4
テキストファイル2を読む
val txt2=sc.textFile(path="/path/to/input/file2")
例えば:
A C 1 5 3 6
結合して結果を印刷します。
txt1.join(txt2).foreach(println)
例えば:
A B C 1 2 5 3 4 6
上記の結合は、最初の列に基づいています。
Modified text is an extract of the original Stack Overflow Documentation
ライセンスを受けた CC BY-SA 3.0
所属していない Stack Overflow