2012-07-26 78 views
1

我想创建多个域的自定义搜索引擎。
如何使用solr与nutch创建500多个域的自定义搜索,同时搜索每个域应该能够显示自己的数据。nutch和solr多域

例如
example.com exapmle2.com example3.com等等,当用户在example.com上搜索时,他应该得到属于example.com的数据,同样适用于example2.com等等

这些网站可能是博客邮政,电子商务网站,分类网站或酒店预订网站。

任何建议,将不胜感激。

+0

当你说域名是什么意思,网站名称像stackoverflow.com或网站类型像消费电子产品? – Umar 2012-07-26 14:57:35

+0

一般来说,您可以使用不同的Solr核心,但是了解更多关于这些域名的信息会更好。例如。它们有多大(你期望有多少文档?平均文档大小?信息域的类型将被存储?域模式之间的差异?任何你能想到的 - 告诉我们......)。它可能会变成你只需要单核心与不同的实体,或不同的访问权限... – 2012-07-26 22:54:57

+0

@umar我的意思是像example.com subdomain like sub.example.com – 2012-07-29 09:26:16

回答

1

这应该是可能的开箱即用。当你使用nutch模式索引solr时,它有一个名为site的字段来存储域。在您选择域名(又名站点)的搜索界面(即您将构建的)上,您只需传递一个过滤器查询(如“site:domain”),以便结果仅限于搜索的域。

注意:如果要限制对注入域的爬网,请确保将外部链接属性设置为nutch为false。

希望能回答你的问题。