0
的包我有一个名为文章我怎么火花数据帧转换为RDD并获得话
+--------------------+
| processed_title|
+--------------------+
|[new, relictual, ...|
|[once, upon,a,time..|
+--------------------+
我要弄平得到它作为文字包数据帧。 如何使用当前情况来实现这一点。我试过下面的代码似乎给我一个类型不匹配的问题。
val bow_corpus = article.select("processed_title").rdd.flatMap(y => y)
我最终想用这个bow_corpus来训练word2vec模型。
由于