我对hbase相当陌生,想象我们想为每个类别每天汇总独特的文档数量。hbase,是否可以使用前缀对行键进行计数?
第一个想法是有点像下面
表名:年月日 行键:category_docid 列族:凡是似乎以后使用,
在这种情况下,我想我可以用rowkey开始扫描前缀和结束前缀,然后计算它们的键。
但有几个问题 1.扫描似乎是重计数操作,因为我必须扫描所有的结果数组,并自行增加。 2.类别不断变化,如果有可能在SQL中做'group by',但是我还没有找到,现在会好得多。
您对这种方法有什么看法,或者还有其他更好的主意吗?
可以考虑添加一个额外的密钥,以保持您感兴趣的密钥模式的计数。因此,您可以执行单个GET操作而不是计数操作/扫描操作。 –