2011-05-15 25 views

回答

2

没有做到这一点,但这绝对是可行的,但需要搭载SOLR代码(src/java/org/apache/nutch/indexer/solr)并将其调整为ElasticSearch。对Nutch来说会是一个不错的贡献BTW

+0

这是我采取的方法。我也编写了自己的elasticsearch索引器和我自己的抓取过程。 – neildf 2011-05-26 11:38:40

3

我知道Nutch会添加可插入的后端,并很高兴看到它。我需要将elasticsearch与Nutch 1.3集成。代码在这里发布。捎带(src/java/org/apache/nutch/indexer/solr)代码。

https://github.com/ctjmorgan/nutch-elasticsearch-indexer

+0

我是新来的java,所以我不知道如何在Ubuntu上创建一个包,然后重建它。我已经在/ home/peter/nutch /位置安装了nutch,所以我不知道在哪里复制ivy文件和java文件。还有什么设置必须添加到常春藤文件? – peter 2012-12-17 04:41:24

10

我写了一个ElasticSearch插件,嘲笑Solr的API。使用这个插件和标准的Nutch Solr索引器,您可以轻松地将抓取的数据发送到ElasticSearch。插件以及如何使用Nutch使用它的一个例子可以在GitHub上找到:

https://github.com/mattweber/elasticsearch-mocksolrplugin

0

时间的推移,现在Nucth已与ElasticSearch集成好。 Here是一个不错的教程。