2016-09-22 91 views
-1

对于我的小POC,我正在寻找任何开放源代码库,使用它我可以利用自然语言处理,最好在java中。基本上我打算有一个应用程序,它从用户输入人类语言的输入,并通过对提供的文档或网页进行筛选来返回结果。任何线索将不胜感激。java中的自然语言处理库

回答

0

“用户输入的人类语言”是文本格式?如果为true,那么您正在查找文本数据检索器。 Apache Lucene真的很有用,一旦有大量的文档,例子,内置的功能,非常容易使用和良好的社区协作。

很多来自人类自然语言的挑战,例如词干和停用词,都非常好且易于使用API​​。例如:

TokenStream tokenStream = new StandardTokenizer(
       Version.LUCENE_36, new StringReader(input)); 
     tokenStream = new StopFilter(Version.LUCENE_36, tokenStream, stopWordsSet); 
     tokenStream = new PorterStemFilter(tokenStream); 

祝你好运!

+0

谢谢!你能指出我在github上的一些例子,或者是在文本中使用自然语言来查询数据的其他地方。 –

+0

当然。你能提供一些查询的例子吗? – Doleron

+0

是的简单查询将来自用户,如“Oracle Webcenter的注册TCP端口是什么?”为了回答这个问题,我需要浏览webcenter的发布文档或通过网络进行搜索。 –