apache-spark
Testy jednostkowe
Szukaj…
Test jednostki liczby słów (Scala + JUnit)
Na przykład mamy WordCountService
z metodą countWords
:
class WordCountService {
def countWords(url: String): Map[String, Int] = {
val sparkConf = new SparkConf().setMaster("spark://somehost:7077").setAppName("WordCount"))
val sc = new SparkContext(sparkConf)
val textFile = sc.textFile(url)
textFile.flatMap(line => line.split(" "))
.map(word => (word, 1))
.reduceByKey(_ + _).collect().toMap
}
}
Ta usługa wydaje się bardzo brzydka i nie jest przystosowana do testów jednostkowych. SparkContext należy wstrzyknąć do tej usługi. Można to osiągnąć za pomocą ulubionego frameworka DI, ale dla uproszczenia zostanie on zaimplementowany za pomocą konstruktora:
class WordCountService(val sc: SparkContext) {
def countWords(url: String): Map[String, Int] = {
val textFile = sc.textFile(url)
textFile.flatMap(line => line.split(" "))
.map(word => (word, 1))
.reduceByKey(_ + _).collect().toMap
}
}
Teraz możemy utworzyć prosty test JUnit i wstrzyknąć testowalną SparkContext do WordCountService:
class WordCountServiceTest {
val sparkConf = new SparkConf().setMaster("local[*]").setAppName("WordCountTest")
val testContext = new SparkContext(sparkConf)
val wordCountService = new WordCountService(testContext)
@Test
def countWordsTest() {
val testFilePath = "file://my-test-file.txt"
val counts = wordCountService.countWords(testFilePath)
Assert.assertEquals(counts("dog"), 121)
Assert.assertEquals(counts("cat"), 191)
}
}
Modified text is an extract of the original Stack Overflow Documentation
Licencjonowany na podstawie CC BY-SA 3.0
Nie związany z Stack Overflow