2015-08-24 90 views
0

我正在使用OpenNLP处理像“在洛杉矶工作的医生”和“住在好莱坞的女性和在圣莫尼卡工作”这样的查询。对于英语理解的人来说,这些句子非常明显,主语是“医生”和“女性”。然而,当我使用opennlp它标记的句子OpenNLP产生不良结果

female_JJ living_NN in_IN hollywood_NN 

[女性生活] [中] [好莱坞]

这里的另一句话“人住在圣莫尼卡和马里布工作和踢足球”被处理

person_NN living_VBG in_IN santa_NN monica_NN and_CC working_VBG in_IN malibu_NN and_CC playing_NN football_NN 
[ person ] [ living ] [ in ] [ santa monica ] and [ working ] [ in ] [ malibu and playing football ] 

为什么OpenNLP的POS tagger错误地标记了它们?这些句子具有最简单的语法结构。如果最先进的NLP技术仍然不能解析这些句子,那么这是否意味着NLP目前还没有实用性?

+0

有趣的例子。你使用哪个OpenNLP版本,以及哪些型号文件?请提供确切的参考资料作为URL或版本标签。 – MWiesner

+0

我使用的是最新版本和en-pos-maxent模型。看来Stanford Parser和NLTK有同样的问题 – Yangrui

+0

因此,版本1.6.0正确吗? – MWiesner

回答

0

所有这些NLP项目的准确性不能100%。因为这些项目正在处理可能性问题。这些错误可以在那里。仍然这些是最准确的工作结果