2013-07-04 65 views
12

阿帕奇Giraph VS Neo4j的:是遍历算法跨节点在论文两个图形处理系统完全不同?如果我们要使用Giraph和Neo4j对存储在单机(不是分布式)中的数据进行社交图表分析,那会更好,为什么呢?Neo4j的VS的Apache Giraph在图遍历

回答

22

传递Neo4j。 Giraph的图计算作为Hadoop作业运行,因为它们旨在用于大型分布式图。管理这些作业的开销太大,无法在伪分布式单机群集上运行的小型图上高效运行。

不仅如此,而且Neo4j的特长是遍历。这是因为Neo4j实际上将相邻关系存储在文件系统中的双向链表中。看看这个博客条目:

http://digitalstain.blogspot.nl/2010/10/neo4j-internals-file-storage.html

它解释的Neo4j优化他们的图表,用于快速图形运算存储诸如遍历的方式方法。

+3

我同意这个答案。 Neo4j是用于实时分析数据的中小型数据集(数百万个节点/关系),而giraph/pregel则是针对大规模分布式工作,用于互联网大小遍历。 – Nicholas