2011-12-13 40 views
8

我需要设置一个可以存储PB级别文件的数据存储器(文件大多是小json,图像和csv文件,但其中一些可能是〜100MB二进制文件)。Riak vs GlusterFS

我正在研究分布式数据存储,这是无主和无单点故障。

我发现了Riak和GlusterFS。

我想问问你们以前的人谁曾使用过他们?

我知道那里的接口(DB/Map)是非常不同的。 但在我看来,他们都使用哈希和类似的分布式技术。 它们是否具有相似的性能,一致性和可用性?

回答

4

我们正在运行一个具有Bitcask后端的17节点(24GB RAM,2T磁盘)Riak集群,存储大约10亿个3k对象。这种设置是高性能的,但是非常耗费资源。我们正在考虑从Riak转移到GlusterFS,因为表现并不是对我们很重要。也许使用LevelDB作为后端也可以减轻我们的后顾之忧。

ATM Riak的自愈性能似乎更强,配置看起来更容易。在你的情况下,我更愿意在GlusterFS上存储100MB文件。

0

存储较大的文件,例如您提到的100MB文件,对于普通的OSS Riak来说不是正确的选择。

在这种情况下,您真正​​应该使用的是刚刚宣布的来自Basho的RiakCS http://basho.com/products/riakcs/

0

选择主要取决于要求。通常我会推荐Riak,如果你实际上并不需要一个真正的文件系统(带有挂载点,ACL管理等等),并且会以编程方式使用或提供文件,否则就是GlusterFS。