2012-10-08 18 views
0

指定名词的频率在文本我有一个文件包含附有POS标记,如用java

Tom/NNP went/VBP to/IN the/DT stadium/NN ....etc 

我需要知道的所有名词的频率包含在此文件中的话。因此,输出可能是

stadium  12 
football 20 
player  13 

其中,这些数字是这些名词出现在文本中的数字时代。我怎么能在java中做到这一点?

+1

通过编写一个使用Map 的程序? – bmargulies

+0

首先阅读[Java IO教程](http://docs.oracle.com/javase/tutorial/essential/io/charstreams.html),当有更具体的问题时再回来。 –

+0

所以你需要匹配所有具有'/ NN'后面的单词并对它们进行计数? – Bergi

回答

1

有一个从字符串(名词)到整数(计数)的地图。遍历文件中的每个单词。检查'/'后的单词部分,如果它是一个名词,如果它不在那里,则将它放在地图上,如果它不在那里,则将其放在地图上,或者将1加到现有值上。然后遍历地图,打印出键/值对。