2017-07-21 103 views
0

我有一个字典的Python字典,它模拟了一组文档中单词的TF-IDF权重。这样的:将字典转换成熊猫DataFrame

Corpus_dict = { “Doc1.txt”:{ '字1':XXXX, '单词2':XXXX,...,wordn:XXX} “Doc2.txt”:{ '字1':XXXX ,'word2':XXXX,...,wordn:xxx}
... “Docm.txt”:{'word1':XXXX,'word2':XXXX,...,wordn:xxx}}

其中xxx是n个单词中每一个单词的TF-IDF值。我想将其转换为如下因素大熊猫数据帧:

keys  Doc1  Doc2 ... Docn 

word1  xxx  xxx   xxx 
word2  xxx  xxx   xxx 
         ... 
word  nxxx  xxx   xxx 

有人可以给我一些帮助?

对不起,因为糟糕的英语和谢谢!

+1

的[创建从字典字典大熊猫数据帧(https://stackoverflow.com/questions/33157522/create-pandas-dataframe-from-dictionary-of-dictionaries) –

回答

2

只需使用

pd.DataFrame(Corpus_dict) 

它会给你想要的数据帧。

发现了类似的问题here

+0

工作得很好可能的复制。谢谢! – yuridamata

0

你的问题的答案是应该像下面的图片。

enter image description here