我有一个Hbase数据库,用于保存wikipedia.org的已爬网信息。我的机器在Amazon Wweb Services。集成Hbase,其中包含Nutch爬行数据和Solr
我已经下载了Solr,然后我想在Hbase索引数据,然后我将搜索它。
我是Solr和Hbase的新手,我该怎么做?
我有一个Hbase数据库,用于保存wikipedia.org的已爬网信息。我的机器在Amazon Wweb Services。集成Hbase,其中包含Nutch爬行数据和Solr
我已经下载了Solr,然后我想在Hbase索引数据,然后我将搜索它。
我是Solr和Hbase的新手,我该怎么做?
所有你需要做的是,运行此命令 - sudo bin/nutch solrindex http://localhost:8983/solr/ -reindex
但在此之前,你这样做,请确保您的Solr实例启动并运行,您可以通过访问此链接http://localhost:8983/solr/
验证,如果你能找到的Solr admin,那么你的Solr实例正在运行。
如果您使用Nutch将数据抓取到hbase中,那么您可以使用Solr和Nutch进行索引。请在这里查看http://wiki.apache.org/nutch/CommandLineOptions – kich 2013-03-22 16:17:06