我正在用Python(Nltk,Pandas)进行一些文本分析,并需要一些帮助。我仍然是一名编程初学者。熊猫:将数据帧列合并到列表
我有一个PoS标记数据帧(1000行,5列)。
列名:编号(在索引),身份证,标题,问题和答案
#2 Example rows for Question:
[('I', 'PRON'), ('am', 'VERB'), ('working', 'VERB'),('website', 'NOUN')]
[('Would', 'VERB'), ('you', 'PRON'), ('recomme...)]
#2 Example rows for Answers:
[('This', 'DET'), ('is', 'VERB'), ('not', 'ADV'),('website', 'NOUN')]
[('There', 'DET'), ('is', 'VERB'), ('a', 'DET'...)]
目标:
1)一个列表(不STR)与所有1000 PoS Tagged Questions
2.)onelist(not str)with all 1000 PoS Tag GED答案
3)一个所有1000个过程标签和解答问题
我试过到目前为止是要合并的问题列中的所有行,但我的结果是一样名单(不STR) :
[[('I', 'PRON'), ('am', 'VERB'),..],[('Would', 'VERB'),
('you', 'PRON'), ('recomme...)],[(.....)]]
我想我加入他们是一个错误。我怎样才能做到这一点,以实现一个列表,看起来像这样:
[('I', 'PRON'), ('am', 'VERB'), ('working', 'VERB'),.....]
为完整的列。 Beneres答案后
编辑:
THX您的快速答复。 的.sum()是我的方法,我以前做过,但结果是:
print (df['Merged'])
0 [('Does', 'NOUN'), ('anyone', 'NOUN'), ('know'...
1 [('I', 'PRON'), ('am', 'VERB'), ('building', '...
2 [('I', 'PRON'), ('am', 'VERB'), ('wondering', ...
3 [('I', 'PRON'), ('am', 'VERB'), ('working', 'V...
我需要的是
print (df['Merged'])
0 [('Does', 'NOUN'), ('anyone', 'NOUN'), ('know'...
('I', 'PRON'), ('am', 'VERB'), ('building', '...
('I', 'PRON'), ('am', 'VERB'), ('wondering', ...
('I', 'PRON'), ('am', 'VERB'), ('working', 'V...]
编辑2: 解决