如何使用OpenNlp的分块解析器基于概率提取有意义的名词短语

-1

我是自然语言处理的新手。我需要根据它们的概率（例如75％及以上）来提取有意义的名词和名词短语来制作自动建议字典。如何使用OpenNlp的分块解析器基于概率提取有意义的名词短语

我一直在阅读在线帖子，文章几天，但只发现了一些信息。我正在考虑使用en-parser-chunking.bin 模型。

有人可以推荐覆盖类似于上述用例的良好资源/示例吗？

我目前的处境：

型号= EN-解析器chunking.bin

串线= “Tutorialspoint是最大的教程库”; （NP（NN Tutorialspoint））（VP（VBZ is）（NP（DT the）（JJS largest）（NN tutorial）（NN library。）））））

Noun_Probability：

Tutorialspoint_0.4482373645195041 tutorial_0.6801141071099344 library._0.5625105229675064

2017-04-14 Wendy

我不认为这种做法是很好的。建议您可以尝试：使用OpenNLP Chunker而不是Parser（它速度更快）。在大语料库中运行并提取名词短语及其频率。也许频率会提示如何建立你的字典。

2017-04-18 13:49:23 wcolen

谢谢，wcolen！是的，我也注意到解析器组块的缓慢。现在将尝试OpenNLP Chunker。 – Wendy

回答