2012-10-23 41 views
0

我正在使用Apache solr,我正在尝试使用语音过滤器工厂,我尝试了所有可用于solr.PhoneticFilterFactory的编码器,但它们都不支持印度语言。是否有任何其他过滤器/方法可用,这样我可以得到印度语言e.g印地文,泰米尔语,孟加拉语等印地语语音过滤器工厂

如果没有,那么我们怎样才能修改现有的过滤器,以支持这些语言语音表示。

回答

0

您是否尝试了新的Beider Morse滤波器工厂,该工厂刚刚在3.6版本中添加,并且(唉)还没有很好记录?

https://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#solr.BeiderMorseFilterFactory

它为中心的语音搜索和东欧姓氏开发的,但也许它会为其他语言的工作了。我个人发现它比Soundex或其他老式的方法好得多。

+0

我试过这个filterFactory它似乎不支持印地语。 – NutchUser

+0

试过这个过滤器。它不适用于印地文名称。 – Vivek