2017-01-29 27 views
1

给定一段文本和几个关键字我想确定哪个关键字最相关。所以我基本上想看看哪个关键字出现次数最多,但比这更复杂一点,因为我想用复数形式和非复数形式搜索关键字,并删除“and”和“the”等通用词。确定文本正文中最相关的关键字

我可以编写一个函数来做一个体面的工作,但不是重新发明轮子我想知道是否有一个很好的nlp库,理想情况下在JS中,处理这种事情,即关键字相关性。在这种情况下,精度比性能更重要,但两者都很重要。

为了给出一个具体的例子,说明顶部以黄色突出显示的三个关键字的用法,“迪士尼”应该是最相关的,因为它发生在文章中的次数最多,并且是最具体的文章。 https://www.guide.com/gift-guide-for-all-the-disney-fanatics-in-your-life/a

+0

[在NPM中搜索NLP](https://www.npmjs.com/search?q=nlp) –

回答