2013-02-21 45 views
1

嗨我正在使用hadoop和cassandra集成的datastax企业。 我配置了3个cassandra节点和2个分析节点(在哪个配置单元上运行)。在cassandra集群上使用配置单元映射减少

所以我很困惑,如果有一些数据不存在于配置单元节点上,但在cassandra节点上,它将不会在映射缩减过程中处理,或者map reduce将从cassandra节点中拉出数据并运行映射缩减。请帮助

所以我有4台机器(复制因子3)

machine 1) cassandra node|token value=0   |data owned(25%) 
machine 2)-cassandra node|token value=2^127*.5 |data owned(33%) 
machine 3)-analytics node|token value=2^127*.25 |data owned(33%) 
machine 4) analytics node|token value=2^127*.75 |data owned(8%) 

不应该被他们拥有25%每 另外我现在认为,数据将在所有节点未在短短3个节点被复制

回答

2

DSE将确保将数据集的完整副本复制到您指定为分析的任何一组节点。所以这通常不是问题。如果足够的分析节点发生故障,则可能必须转到非分析节点才能获取数据......但建议您最好重新使分析节点联机。

+1

感谢您的回答。但我的数据所有者船未能正常运行。你能建议吗? – 2013-02-27 07:33:56

+0

“DSE将确保将数据集的完整副本复制到[对分析节点]”。 这种行为记录在某处? – 2013-05-10 23:32:27

+0

http://www.datastax.com/docs/datastax_enterprise3.0/deploy/configuring_replication – jbellis 2013-05-27 22:19:53

相关问题