0
我想要的结果是包含'car'的结果也会显示出来,如果我在英语中搜索'vehicle'和其他这样的同义词。Solr英语同义词标准列表
我知道Solr有SynonymFilterFactory,默认情况下它是空的。但是我很好奇,如果有一个标准化的方式来标准化英语的所有单词。我应该从同义词库生成synonym.txt吗?
正在做这个标准的做法还是有更好的方法来处理?
我想要的结果是包含'car'的结果也会显示出来,如果我在英语中搜索'vehicle'和其他这样的同义词。Solr英语同义词标准列表
我知道Solr有SynonymFilterFactory,默认情况下它是空的。但是我很好奇,如果有一个标准化的方式来标准化英语的所有单词。我应该从同义词库生成synonym.txt吗?
正在做这个标准的做法还是有更好的方法来处理?
看看WordNet。这是一个标准的英文词库包。它包含在Python的NLTK包中,编写脚本将其转换为SynonymFilterFactory所需的格式应该不是很多工作。
但@jay的观点,你会得到很多你可能不想要的点击。花一些时间将您的词库定制到您的域名将会带来收益!
同义词高度依赖于搜索领域。 Java对于非程序员来说可能意味着咖啡 - 这是一个不好的例子,但是希望你明白了我所说的内容。从同义词库生成同义词可能会给你一些非常混乱的结果。搜索的受众群体/客户是谁?您可以从首字母缩写词开始,并针对您的特定域名进行扩展。 – jay