我打算做一个利基搜索引擎。我使用apache-nutch-1.6作为搜索器,使用apache-solr-3.6.2作为搜索器。我必须说,网上关于这些技术的信息非常少。如何修改Solr提供的搜索结果页面?
我按照这个教程http://wiki.apache.org/nutch/NutchTutorial已成功安装Apache和solr在我的Ubuntu系统上。我也成功地将种子URL注入到webdb并执行爬网。
使用solr界面http://localhost:8983/solr/admin
,我也可以查询抓取的结果。但这是我收到的结果。 。
我错过了这里的东西,早期的apache-nutch-0.7有一场战争,它产生了一个清晰的html输出。 。我如何达到这个目标......或者如果有人能指点我最新的教程或指南,非常感谢。
你到现在为止尝试过什么?你有没有做谷歌(如果不是)搜索?这里有一个非常类似的问题:http://stackoverflow.com/questions/2411330/how-to-format-solr-result-documents – Oerd
@Oerd:我确实看到了这个问题,我发布了我的查询后,一大堆学习和研究。这篇文章[链接](http://stackoverflow.com/questions/2411330/how-to-format-solr-result-documents)绝对建议使用xslt,但我想知道如果这是首选的方式。 –
xslt *是*转换/样式xml文档的标准方式 – Oerd