2016-12-06 95 views
0

我有一个Jupyter Python笔记本,其数据矩阵与 中的某些字出现在SFrame文档中。列名 是['great','bad',....],并且每行在列表的不同行上出现 的数量(对不起,我无法从VM获取 截图)。因此,行值都是非负整数 0,1,2,...在Jupyter笔记本中创建矩阵

我想创建一个矩阵2列11行rows.Each有两个项目:一个 包含每个字的名字另一个条目包含单词的总数(对固定列的所有行进行总和)。这些词是名为“选定词”的列表的一部分。我有点笨, 我知道如何为现有的SFrame创建新的列,但不知道如何创建新的SFrame或其他Python数据结构。我最好的是:

for word in selected_words: 
    count[word]=products[word].sum() 
    print [word, count[word]] 

我也想过创建一个其他文件格式的矩阵和导入它。但后来我不知道如何

任何想法? 谢谢。

+0

你必须使用SFrame吗?熊猫可能更容易 – maxymoo

回答

0

我发现的最简单的方法是创建一个Python字典。

'selected_words'是您的单词的Python列表,因此只需遍历每个单词并使用每个关键词和出现次数来构建词典。

totals = {} 
for word in selected_words: 
    totals[word] = products[word].sum() 

然后,你可以输入IPython的totals,它会给你每个单词的字典,它的数量。