-1
对于我的小POC,我正在寻找任何开放源代码库,使用它我可以利用自然语言处理,最好在java中。基本上我打算有一个应用程序,它从用户输入人类语言的输入,并通过对提供的文档或网页进行筛选来返回结果。任何线索将不胜感激。java中的自然语言处理库
对于我的小POC,我正在寻找任何开放源代码库,使用它我可以利用自然语言处理,最好在java中。基本上我打算有一个应用程序,它从用户输入人类语言的输入,并通过对提供的文档或网页进行筛选来返回结果。任何线索将不胜感激。java中的自然语言处理库
“用户输入的人类语言”是文本格式?如果为true,那么您正在查找文本数据检索器。 Apache Lucene真的很有用,一旦有大量的文档,例子,内置的功能,非常容易使用和良好的社区协作。
很多来自人类自然语言的挑战,例如词干和停用词,都非常好且易于使用API。例如:
TokenStream tokenStream = new StandardTokenizer(
Version.LUCENE_36, new StringReader(input));
tokenStream = new StopFilter(Version.LUCENE_36, tokenStream, stopWordsSet);
tokenStream = new PorterStemFilter(tokenStream);
祝你好运!
谢谢!你能指出我在github上的一些例子,或者是在文本中使用自然语言来查询数据的其他地方。 –
当然。你能提供一些查询的例子吗? – Doleron
是的简单查询将来自用户,如“Oracle Webcenter的注册TCP端口是什么?”为了回答这个问题,我需要浏览webcenter的发布文档或通过网络进行搜索。 –