2013-02-01 77 views
3

我使用nutch 3域(domain01,domain02和domain03)进行爬网。 我想得到所有包含特定关键字(例如“冠军联赛”)的帖子,并且比结果首先显示来自domain02的帖子,来自domain01的下一帖子和来自domain03的最后帖子。只是我想按域排序优先Apache solr设置域优先级

如果有方法来设置域的优先级?

回答

2

如果您始终具有相同的域顺序,那么您可以使用索引时间文档级别提升或查询时间按域(或domainorder)进行排序,然后按分数进行排序。

如果域的顺序取决于查询,您可以使用QueryElevationComponent,但我认为您必须提供完整的ID列表,然后针对每个高程规则,并且可能不支持顺序。

您也可以编写自己的Custom Function Query或组件(类似于查询高程一)。