2011-12-09 21 views

回答

0

TableOutputFormat通过调用:table.setAutoFlush(false)启用客户端缓冲机制。当作业完成时table.flushCommits()TableRecordWrter.close()调用。默认的缓冲区大小为中等2MB,您可以更改属性hbase.client.write.buffer

我觉得HBase的服务器不知道是否修改由MapReduce工作

0

在做的理想的事情犯的价值您的情况是在您的MR作业中添加内部计数器,以便在作业跟踪器上显示内部计数器。您可能希望根据您正在对HBase进行的“投入”数量更新这些计数器。

http://diveintodata.org/2011/03/15/an-example-of-hadoop-mapreduce-counter/

这篇文章可以帮助你更好。

+0

是的,我已经有柜台了,我正在从MR作业写入HBase表,并试图从我的基于Web的HBase客户端同时读取它,但没有看到任何内容,所以我只想检查一下。 我还有另一个正在加载的MR作业,中途失败了,我不确定是否会从那个失败的作业中得到流浪的残余行,但看起来它很干净。 –

相关问题