的我从DF列转换的RDD了DF coulmn
##converting a column into an rdd
rdd = eDF_review_split.select('splReview').rdd.map(list)
##print rdd.take(10)
我得到的结果是由一个RDD如下
[[u'Installing'], [u'the'], [u'game'], [u'was'], [u'a'], [u'struggle'], [u'(because'], [u'of'], [u'games'], [u'for']]
这是有意义的,因为这些话是从不同的行。
如何将其制作为如下所示的格式?
[u'Installing', u'the', u'game', u'was', u'a', u'struggle', u'(because', u'of', u'games', u'for']
我需要这样做,所以我可以做一个适当的字数。
'eDF_review_split'的模式是什么?你能提供一个采样数据吗? – MaFF
为什么要把你的列表拼成一个简单的字数?您可以并行执行减少 –