我的apache nutch正在爬行,并且在日志文件中出现以下错误。HBase Nutch error [Ljava.lang.StackTraceElement
错误store.HBaseStore - 连接被拒绝情节中字00:00:38255 ERROR store.HBaseStore - [Ljava.lang.StackTraceElement; @ 6dce5061
如何消除这种误差。根据我的搜索,这个错误是因为hbase而不是nutch。这个问题被张贴here,但它没有答案。我必须得到这个问题,如果没有得到答案,这就是为什么我再次张贴。
我的一些小簇的信息是以下的(2机群集)
在机器之一,Hadoop和HBase的正在运行
在机器2,apache的Nutch的履带式(2.2.1)正在运行。
当我检查hbase和hadoop的日志文件时,没有任何关于bug的信息。由于这个bug,爬网的数据不会被保存在hbase(machine1)中。对于我和我的抓取工具而言,这是一个真正的问题,不适合抓取工具。表格中已有大约266 GB的已抓取数据。
http://wiki.apache.org/nutch/Nutch2Tutorial?action=show&redirect=GORA_HBase – Kumar 2014-11-26 07:07:31