2014-04-05 42 views
0

仍然有这个问题!在MYSQL中调整术语频率?

我在SQL有4个字段的表:FILEID,SENTENCEID,WORDID和WORD。

我在每个文件下面给出每个文件下的给定文件编号,每个文本下每一个句子下面都有一个唯一编号,我给每个单词指定一个唯一编号,如图所示。

我正在计算单词在每个文档中显示的次数。我只知道如何计算一个术语在此表中总共显示的次数。任何人都可以建议如何基于FILEID计算?非常感谢。 Below是我拥有的表格。

enter image description here

这是我当前的查询:

SELECT WORD, COUNT(*) FROM (SELECT WORD FROM ASSIGNMENT2 GROUP BY FILEID); 
+0

这是很难没有看到你的数据库架构来回答。另外,“term”和“document”是什么意思? – ATG

+0

这是多个文件的集合。图片中的FILEID表示不同的文件。术语是指单词。在一个句子中,每个单词都有一个唯一的ID,从1,2,3,4 ... ...一旦句子结束,我将重新分配1,2,3 ......到一个新句子中的单词。 –

+0

好的。那么,我的理解是,我正确地找出了某个特定单词出现在特定文件中的次数? – ATG

回答

1

我会说:

select FILEID, WORD, count(WORD) from ASSIGNMENT2 group by FILEID, WORD