2017-04-14 37 views
-1

我是自然语言处理的新手。我需要根据它们的概率(例如75%及以上)来提取有意义的名词和名词短语来制作自动建议字典。如何使用OpenNlp的分块解析器基于概率提取有意义的名词短语

我一直在阅读在线帖子,文章几天,但只发现了一些信息。我正在考虑使用en-parser-chunking.bin 模型。

有人可以推荐覆盖类似于上述用例的良好资源/示例吗?

我目前的处境:

型号= EN-解析器chunking.bin

串线= “Tutorialspoint是最大的教程库”; (NP(NN Tutorialspoint))(VP(VBZ is)(NP(DT the)(JJS largest)(NN tutorial)(NN library。)))) )

Noun_Probability:

Tutorialspoint_0.4482373645195041 tutorial_0.6801141071099344 library._0.5625105229675064

回答

1

我不认为这种做法是很好的。建议您可以尝试:使用OpenNLP Chunker而不是Parser(它速度更快)。在大语料库中运行并提取名词短语及其频率。也许频率会提示如何建立你的字典。

+0

谢谢,wcolen! 是的,我也注意到解析器组块的缓慢。现在将尝试OpenNLP Chunker。 – Wendy

相关问题