2010-01-26 43 views

回答

102

Sharding几乎是复制的对立面,尽管它们是正交的概念并且可以很好地协同工作。

分片(也称为分区)正在按键分割数据;而复制也称为镜像,即复制所有数据。

分片可用于提高性能,减少任何资源的命中和内存负载。复制对读取的高可用性很有用。如果您从多个副本中读取数据,则还会降低所有资源的命中率,但所有资源的内存要求保持不变。应该注意的是,尽管您可以写入从站,但复制只有主站 - >从站。所以你不能用这种方式来扩展写入。假设你有以下元组:[1:Apple],[2:Banana],[3:Cherry],[4:Durian],并且我们有两台机器A和B.对于Sharding,我们可能存储密钥机器A上2,4;和机器B上的键1,3。通过复制,我们在机器A上存储键1,2,3,4和在机器B上存储1,2,3,4。

分片通常通过执行一致的散列在钥匙上。上面的例子是用下面的哈希函数h(x){return x%2 == 0?A:B}实现的。

要结合这些概念,我们可能会复制每个分片。在上述情况下,机器A的所有数据(2,4)可以在机器C上复制,机器B的所有数据(1,3)可以在机器D上复制。

任何键 - 值存储(其中Redis只是其中一个示例)支持分片,但某些交叉键功能将不再起作用。 Redis支持开箱即用的复制。

+6

很酷。我认为答案不仅限于redis – joetsuihk 2010-03-11 04:48:44

+3

良好的答案(一般),但并没有真正回答问题imho :) – 2010-04-22 11:17:05

+2

我认为这个答案提供了一个很好的回应提问者问。大大简化,但正确的解释。 +1 – 2011-12-09 04:06:08

14

简而言之,这两个概念之间的根本区别在于,分片用于缩放写入,而复制用于缩放读取。正如Alex已经提到的,Replication也是实现HA的解决方案之一。

是的,如果考虑如何在集群中的节点上复制碎片,它们通常都会一起使用。

关于你的第三个问题,而不是RAM刷新选项,使用Redis Append Only File(AOF)是一个更好的主意。只需很小的成本(就写入速度而言),您可以获得更多的写入可靠性。这很像mysql二进制日志。建议使用1 fsync /秒。