3
test.csv
name,key1,key2
A,1,2
B,1,3
C,4,3
我想改变这个数据是这样的(如数据集或RDD)火花 - 与阶
whatIwant.csv
name,key,newkeyname
A,1,KEYA
A,2,KEYB
B,1,KEYA
B,3,KEYB
C,4,KEYA
C,3,KEYB
.csv数据分割我与读取方法加载的数据。
val df = spark.read
.option("header", true)
.option("charset", "euc-kr")
.csv(csvFilePath)
我可以加载每个数据集一样(名称,键1)或(名称,密钥2),以及他们的工会工会,但要做到这一点星星之火会议。 对此有何想法?
那些不工作。
val df2 = df.select(df("TAG_NO"), df.map { x => (x.getAs[String]("MK_VNDRNM"), x.getAs[String]("WK_ORD_DT")) })
val df2 = df.select(df("TAG_NO"), Seq(df("TAG_NO"), df("WK_ORD_DT")))
你尝试'从数据帧explode'功能? – Shankar
nope。我会尝试爆炸。谢谢:) –
因为key1和key2不在单列中,所以我认为explode并不是正确的答案。 –