0
指定名词的频率在文本我有一个文件包含附有POS标记,如用java
Tom/NNP went/VBP to/IN the/DT stadium/NN ....etc
我需要知道的所有名词的频率包含在此文件中的话。因此,输出可能是
stadium 12
football 20
player 13
其中,这些数字是这些名词出现在文本中的数字时代。我怎么能在java中做到这一点?
指定名词的频率在文本我有一个文件包含附有POS标记,如用java
Tom/NNP went/VBP to/IN the/DT stadium/NN ....etc
我需要知道的所有名词的频率包含在此文件中的话。因此,输出可能是
stadium 12
football 20
player 13
其中,这些数字是这些名词出现在文本中的数字时代。我怎么能在java中做到这一点?
有一个从字符串(名词)到整数(计数)的地图。遍历文件中的每个单词。检查'/'后的单词部分,如果它是一个名词,如果它不在那里,则将它放在地图上,如果它不在那里,则将其放在地图上,或者将1加到现有值上。然后遍历地图,打印出键/值对。
通过编写一个使用Map的程序? –
bmargulies
首先阅读[Java IO教程](http://docs.oracle.com/javase/tutorial/essential/io/charstreams.html),当有更具体的问题时再回来。 –
所以你需要匹配所有具有'/ NN'后面的单词并对它们进行计数? – Bergi