0
我需要使用斯坦福POS标记器标记Tweets中的文字。斯坦福POS标记器的POS直方图
如这里1解释的,我使用的类MaxentTagger,然后方法:maxtagger.tagString("This is a sample text");
这产生输出:
This_DT is_VBZ a_DT sample_NN text_NN
现在,我必须为每条推文创建每个标签发生的直方图推文。我在JavaDoc中搜索过,但没有发现任何用处。
如果我必须自己创建直方图,如何以其他方式读取输出而不是字符串(例如,标记列表)?
似乎很好,但我怎么能得到一个对象: java.util.List <?从字符串文本扩展HasWord> ? – Francesco