我对cassandra有点新鲜。 我创建了一个如下表格 创建表格事件(日期文本,小时文本,sip文本,dip文本,计数,计数器, 主键((日,小时),sip,dip));如何避免在cassandra集群键列上排序
我们的用例是,应用程序每秒收到很多事件。我们希望每天每小时都有一个分区分区,如果再次收到相同的事件,我们需要更新计数器。并且我们还希望为dip和sip列组合使用独特的条目,因此我将它们作为主键的一部分。
在此处,sip列正在形成一个集群键,在将记录插入表中时发生排序。在我们的案例中,这些列不需要排序,排序是一个开销,而我们在表中包含数百万行。如何避免这种排序开销,任何人都可以帮助我吗?
排序在这种情况下可能不是开销。要更新计数器,您必须执行如下操作:'UPDATE events SET count = count + 1 WHERE day = in_day and hour = in_hour and sip = in_sip and dip = in_dip;' Cassandra需要将记录分类以便快速到达这一行。 –