我使用的Spark 1.5.1使用Scala 2.10.5星火1.5.1,斯卡拉2.10.5:如何扩大的RDD [数组[字符串],矢量]
我有一个RDD[Array[String], Vector]
每个在RDD的元素:
- 我想借此在
Array[String]
每个String
,并与Vector
结合起来 创建元组(String, Vector)
,这一步会导致创建几个元组从的每个元素初始RDD
我们的目标是通过建立元组的RDD来结束:RDD[(String, Vector)]
,这RDD包含在上一步中创建的所有元组。
谢谢