2013-04-01 88 views
1

我正在寻找一个旨在处理树结构化数据的数据库。我研究过Neo4j,它很好,但它并不真正支持分片。另一方面,Couchbase并不是真正为单一数据树构建的(根据我的理解)。树状结构化数据的分布式数据库?

数据树理论上很容易在服务器之间进行拆分,而完整的图形则不然。我不需要完整图的好处,因为我需要动态分割大数据集的能力。完整的数据集不适合单个服务器。

的功能,我需要的(解释,就好像它是一个正常的计算机文件系统):

  1. 在一些“文件夹”排除“子文件夹”
  2. 拆分数据库(和负载选择每个节点)在冗余服务器之间

系统负载将大部分读取(大约90%)。

谢谢!

+0

有多大规模数据集?在需要它之前,你可能会过早地优化你的代码。你有什么想法可以拆分?你说树已经成熟分解了,但是你能否详细说明一下,因为我可以看到许多树具有与图分割相同的问题。 – Nicholas

+0

http://thinkaurelius.com/2013/03/30/titan-server-from-a-single-server-to-a-highly-available-cluster/查看泰坦。图形数据库按比例缩放 - 甚至碎片。 – ryan1234

+0

@Nicholas它将大约1GB-100TB,但我希望它可以一路扩展。我可以在任何“文件夹级别”进行分割,即将一半的“文件夹”放在一台服务器上,另一半放在另一台服务器上,对不对? –

回答

0

我评论,因为我想尝试和帮助,并没有想到我的链接是真正的答案值得。 =)

我一直密切关注泰坦,它现在似乎是非常流血的边缘。在阅读文章(http://thinkaurelius.com/2013/03/30/titan-server-from-a-single-server-to-a-highly-available-cluster/)之后,他们似乎在某种程度上使用了Cassandra,所以Cassandra的规模与泰坦的规模密切相关。

从文章看来,你不必显式分解数据。当它达到一定的尺寸时它会自动分配给你。

这里是关于泰坦另一个演示以及它如何使用卡桑德拉:http://blog.andreamostosi.name/2013/03/titan-distributed-graph-database/

+0

使用最新解决方案有哪些风险? –

+0

如果我是你,我会立即联系到泰坦的家伙,并建立关系。如果你从不与他们交谈,那么你冒着某种错误的风险,并且没有任何支持/不知道发生了什么。风险在于你会写出一大堆反对泰坦的代码,并且它会变得不可用或变得无法使用。 Neo4j有其背后的历史,但泰坦可能是下一个最好的。这可能看起来像一个警察,但这些日子里很多最新鲜的东西都在Twitter上。按照@aureliusgraphs并问他们的问题。我敢打赌他们回答! – ryan1234

+0

@aureliusgraphs仍然没有回应。由于它基于cassandra,它是否和cassandra具有相同的限制?而且,cassandra如何知道要在哪台服务器上存储什么,以尽量减少跨服务器的图遍历? –