2011-06-22 42 views
4

我们计划部署Solr以搜索从常见CMS平台发布的多个网站。单核或多核Solr

每种语言都会有不同的网站,其他语言大多都有英文翻译的内容。

搜索要求包括 - 关键字突出显示,建议(“你的意思是?”),停用词,分面。

我们正在评估使用单核vs多语言多核Solr选项。这里推荐的方法是什么?

回答

6

你需要多核,因为你不能做词干和停用词多语言数据库在多个内核上。

英语中常用的停用词是“by”和“is”,但这些词在许多北欧语言中的意思是“城镇”和“冰”。

如果您执行多核,每种语言都可以在自己的核心上使用自定义schema.xml来选择正确的词干,停用词和受保护的词。但同一个JVM在同一台服务器上运行它,所以你不会花费额外的钱用于某种特定语言的服务器。然后,如果一台服务器的负载太大,您可以复制多核设置,并且所有索引均可从复本中受益。