关于如何在pyspark 1.6.1中将rdd转换为数据帧并将数据帧转换回rdd的任何示例? toDF()
不能在1.6.1中使用?如何在pyspark 1.6.1中将rdd转换为数据框?
例如,我有一个这样的RDD:
data = sc.parallelize([('a','b','c', 1,4), ('o','u','w', 9,3), ('s','q','a', 8,6), ('l','g','z', 8,3), \
('a','b','c', 9,8), ('s','q','a', 10,10), ('l','g','z', 20,20), ('o','u','w', 77,77)])