据我所知,几乎所有的拼写检查都基于单个查询词,并且无法对整个输入查询进行更改以增加corpra中的覆盖率。我有一个在lingpipe,但它是非常昂贵的... http://alias-i.com/lingpipe/demos/tutorial/querySpellChecker/read-me.html有没有可以处理空格插入/删除拼写错误的lucene/solr拼写检查器?
所以我的问题什么是最好的替代灵巧类似拼写检查的Apache的Apache?
据我所知,几乎所有的拼写检查都基于单个查询词,并且无法对整个输入查询进行更改以增加corpra中的覆盖率。我有一个在lingpipe,但它是非常昂贵的... http://alias-i.com/lingpipe/demos/tutorial/querySpellChecker/read-me.html有没有可以处理空格插入/删除拼写错误的lucene/solr拼写检查器?
所以我的问题什么是最好的替代灵巧类似拼写检查的Apache的Apache?
lucene中的拼写检查与其他任何字符一样对待空格。所以一般来说,你可以为他们提供你的查询日志或任何内容,并拼写检查/自动完成全部查询。
对于Lucene的这应该只是工作,为Solr的你需要确保QueryConverter不分割你的条件......看到https://issues.apache.org/jira/browse/SOLR-3143
在另一方面,这些suggesters目前整体上投入工作,所以如果您想要提出以前从未搜索过的查询,则可以使用与http://googleblog.blogspot.com/2011/04/more-predictions-in-autocomplete.html类似的最后N个单词。
我希望我们很快也会提供这种风格的建议作为替代,可能在https://issues.apache.org/jira/browse/LUCENE-3842。
但请记住,这不适合所有目的,所以我认为它可能只是一个选项。例如,如果您正在进行电子商务,则没有意义建议您不销售产品:)