好吧,我一直在寻找解释一段时间,但仍然找不到答案。卡桑德拉索引解释
当我们谈论卡桑德拉指数,我得到了要点,其上的是:
- 做高或非常低的基数数据未使用
在低基数我明白了 - 搜索时我们会得到很宽的行。
但是,在高基数数据的幕后发生了什么?所有的书籍和博客似乎都复制了datastax的例子,它没有解释为什么,只是告诉你不要这样做。
假设我想在用户电子邮件上创建一个索引。如果我理解正确的,当我搜索用户通过电子邮件,两件事情将会发生:
- 要求所有节点,其中一个具有通过用户ID 从正确的分区与此相关的电子邮件
- 获得用户的用户ID
如果我在用户国家(这似乎是更合适的字段)创建索引,算法应该是相同的。
因此,请解释我从理解为什么在高基数数据上使用索引时错过了什么。
另外,关于相关主题:有没有一种情况,当索引比物化视图更优先?