2016-08-03 19 views
0

当我每分钟读取cassandra表时,会忽略掉一些数据,例如,假设现在是2016-08-03 09:00:00,表中有1000行数据,但我只读取了600行数据。如何才能我解决了这个问题?没有错误信息为什么阅读cassandra数据可以跳过一些数据?

+0

什么是您的复制配置以及您在群集中使用了多少台服务器?读取和写入之间的时间跨度是多少?如果您有多个服务器,则可能正在写入一个节点,并且数据尚未复制,而您正在从另一个节点读取数据。卡桑德拉最终是一致的。 –

回答

0

请检查复制因子(多个节点上的数据复制数)和Consistency Level

假设您已经配置了4节点cassandra集群设置并将复制因子配置为3作为密钥空间。无论您插入什么数据,最终都可以获得三份数据副本。这是为了适应任何节点的故障。在这个设置中,即使一个节点向下,cassandra也会正常工作。

根据您的需要,您可以在cassandra中配置一致性。我怀疑你在这里使用低准备一致性。您可以尝试读取一致性为'法定人数'。

+0

我有尝试的一致性'法定',但它发生超时。在我的任务中,我经常在1分钟内执行'选择''删除''插入'。有什么方法快速地操作我的操作? – shaojie