1
我如何转换的RDD具有以下结构转变为数据帧中阶转换一个RDD成数据帧星火
org.apache.spark.rdd.RDD[(Long, org.apache.spark.mllib.linalg.Vector)] = MapPartitionsRDD[42]
这里RDD的每一行都包含一个索引Long
和矢量org.apache.spark.mllib.linalg.Vector
。
我想将org.apache.spark.mllib.linalg.Vector
的每个组件放在一行数据框的单独列中。
您是否尝试过使用rdd.toDF()?它隐含在 –
@AndreiT。它不会创建我想要的数据框,我想将'org.apache.spark.mllib.linalg.Vector'的每个组件放在单独的列中。 –
矢量有多少条目? –