0
我正在使用OpenNLP处理像“在洛杉矶工作的医生”和“住在好莱坞的女性和在圣莫尼卡工作”这样的查询。对于英语理解的人来说,这些句子非常明显,主语是“医生”和“女性”。然而,当我使用opennlp它标记的句子OpenNLP产生不良结果
female_JJ living_NN in_IN hollywood_NN
[女性生活] [中] [好莱坞]
这里的另一句话“人住在圣莫尼卡和马里布工作和踢足球”被处理
person_NN living_VBG in_IN santa_NN monica_NN and_CC working_VBG in_IN malibu_NN and_CC playing_NN football_NN
[ person ] [ living ] [ in ] [ santa monica ] and [ working ] [ in ] [ malibu and playing football ]
为什么OpenNLP的POS tagger错误地标记了它们?这些句子具有最简单的语法结构。如果最先进的NLP技术仍然不能解析这些句子,那么这是否意味着NLP目前还没有实用性?
有趣的例子。你使用哪个OpenNLP版本,以及哪些型号文件?请提供确切的参考资料作为URL或版本标签。 – MWiesner
我使用的是最新版本和en-pos-maxent模型。看来Stanford Parser和NLTK有同样的问题 – Yangrui
因此,版本1.6.0正确吗? – MWiesner