2016-01-26 51 views
0

我在Hbase有一个很大的列,比如:columnfamilyName:sampleRaw。列sampleRaw的数据大小可能是20MB,甚至每行大50MB。现在我想要统计表中有多少行sampleRaw。命令count不正确,它不知道该行是否有列sampleRaw。命令scan太慢,因为它试图打印出列sampleRaw,而它非常大。Hbase如何计算非常大的列

例如,我想这个命令:

scan 'bigRaw',{COLUMNS=>['rawf':'sample']} 
+0

你能粘贴你的代码吗? –

+0

我没有编写代码,我只是使用scan'bigRaw',{COLUMNS => ['rawf':'sample']}但列太大而无法扫描,屏幕会在一段时间后崩溃。 – Jack

回答

1

如果你可以使用Java客户端,您可以尝试在柱基as you can see here KeyOnlyFilter这样的数据不会传输到您通过网络,这将是快shell“count”命令。