1
嗨我正在使用hadoop和cassandra集成的datastax企业。 我配置了3个cassandra节点和2个分析节点(在哪个配置单元上运行)。在cassandra集群上使用配置单元映射减少
所以我很困惑,如果有一些数据不存在于配置单元节点上,但在cassandra节点上,它将不会在映射缩减过程中处理,或者map reduce将从cassandra节点中拉出数据并运行映射缩减。请帮助
所以我有4台机器(复制因子3)
machine 1) cassandra node|token value=0 |data owned(25%)
machine 2)-cassandra node|token value=2^127*.5 |data owned(33%)
machine 3)-analytics node|token value=2^127*.25 |data owned(33%)
machine 4) analytics node|token value=2^127*.75 |data owned(8%)
不应该被他们拥有25%每 另外我现在认为,数据将在所有节点未在短短3个节点被复制
感谢您的回答。但我的数据所有者船未能正常运行。你能建议吗? – 2013-02-27 07:33:56
“DSE将确保将数据集的完整副本复制到[对分析节点]”。 这种行为记录在某处? – 2013-05-10 23:32:27
http://www.datastax.com/docs/datastax_enterprise3.0/deploy/configuring_replication – jbellis 2013-05-27 22:19:53