2015-05-14 42 views
2

我有一个这样的表Cassandra-计数卡桑德拉列族中的用户数量?

CREATE TABLE DATA_HOLDER (USER_ID TEXT, RECORD_NAME TEXT, RECORD_VALUE BLOB, PRIMARY KEY (USER_ID, RECORD_NAME)); 

我想在我的上表中计算不同的USER_ID?有什么办法可以做到吗?

我卡桑德拉的版本是:

[cqlsh 4.1.1 | Cassandra 2.0.10.71 | DSE 4.5.2 | CQL spec 3.1.1 | Thrift protocol 19.39.0] 

回答

1

选择表达式定义为:

selection_list 
| DISTINCT selection_list 

,所以你可以:

SELECT DISTINCT USER_ID FROM DATA_HOLDER; 
+0

好卡桑德拉内部有一个限制,它会返回这些很多行?我如何解决这个问题?这个查询不会返回cassandra中的完整行。 – john

+0

如果你有成千上万的人,你应该用火花做或者使用一个计数器来保持它是最新的(或者2的组合)。 –