我需要问一些关于Azure的问题。我想知道如何将.jar文件传入群集,以便您可以从命令行群集azure启动。CountWord在集群azure上使用火花
我也想知道我写的代码在scala中是否正确,特别是如果它是使用wasb://
函数从blob获取文件的正确方法。
import scala.io.Source
import org.apache.spark.SparkContext
import org.apache.spark.SparkContext._
import org.apache.spark.SparkConf
object SimpleApp {
def main(args: Array[String]) {
val textFile =
spark.textFile("wasb://[email protected]/prova.txt")
val counts = textFile.flatMap(line => line.split(" "))
.map(word => (word, 1))
.reduceByKey(_ + _)
counts.saveAsTextFile("wasb://[email protected]/provaoutput.txt")
}
}
而最后一个问题了启动程序,这是正确的代码:
C:\apps\dist\spark-1.2.0\bin\spark-submit --class "SimpleApp" --master local target/scala-2.10/simpleapp_2.10-1.0.jar