2013-03-10 42 views
0

我有一个Hbase数据库,用于保存wikipedia.org的已爬网信息。我的机器在Amazon Wweb Services。集成Hbase,其中包含Nutch爬行数据和Solr

我已经下载了Solr,然后我想在Hbase索引数据,然后我将搜索它。

我是Solr和Hbase的新手,我该怎么做?

+1

如果您使用Nutch将数据抓取到hbase中,那么您可以使用Solr和Nutch进行索引。请在这里查看http://wiki.apache.org/nutch/CommandLineOptions – kich 2013-03-22 16:17:06

回答

0

所有你需要做的是,运行此命令 - sudo bin/nutch solrindex http://localhost:8983/solr/ -reindex

但在此之前,你这样做,请确保您的Solr实例启动并运行,您可以通过访问此链接http://localhost:8983/solr/验证,如果你能找到的Solr admin,那么你的Solr实例正在运行。

+0

-reindex和-index有什么区别? – kamaci 2013-09-20 12:14:07

+0

正如词语所暗示的-reindex应该是对任何现有索引内容进行重新索引,并对任何新内容进行索引。 – sunskin 2013-10-07 19:30:49

+0

您还可以尝试 - bin/nutch solrindex http:// localhost:8983/solr/-all – sunskin 2013-10-07 19:31:31