6
我正尝试使用Apache Spark从管道(“|”)分隔文件生成格式化的CSV文件。输入文件包含:Apache Spark RDD拆分“|”
苹果|球|猫
布莱克顿|贝拉vista |格里纳克
X | Y | Z
我与努力:
val name= sc.textFile(input.txt")
val split=name.map(line=>line.split("|")).map(x => (x(0),x(2)))
split.foreach(println)
输出:
(X,Y)
(A,P)
(B,A)
我所需的输出是:
(苹果,猫)
(黑镇,格里纳克)
(X,Z)