2010-08-21 49 views
5

我一直在使用OpenLink Virtuoso作为RDF存储一段时间,虽然它对于大数据很好,但我对使用SPARQL的图遍历性能不满意。最近我听说了很多关于Neo4j的遍历性能,并认为它值得一试。因此,为了拥有一个具有良好遍历性能的大型RDF存储,切换到Neo4j更好吗?Neo4j vs OpenLink Virtuoso

我不知道Neo4j的大数据性能和良好的性能,Neo4j的RDF/SPARQL部分看起来并不成熟。谢谢你的时间。

+0

请参阅基于SPARQL这个传递爬行例子。后端拥有29亿+三元组。链接:http://lod.openlinksw.com/b3s/search.vsp?q=6 – 2011-12-03 00:37:16

回答

4

Virtuoso "Transitivity in SPARQL"将是图遍历的推荐方法。我们还有一个tutorial on Transitivity提供一些示例查询。我们还提供针对我们的LOD Cloud Cache (30+ billion triples)URIBurner (500+ million triples)实例的实例查询。我们对Virtuoso Transitivity and Graphs for SQL博客文章也将是有趣的阅读...

(由休·威廉姆斯,OpenLink的软件回答)

+0

非常感谢,我要跳过这个。还有一个问题出现在我的脑海里,与ODBC或JDBC相比,如何查询cURL会降低性能? – parsa 2010-08-24 05:40:46

0

能否请您在Virtuoso遇到的图遍历性能问题中提供更多信息,以便我们可以提供有关如何改进此问题的建议。还请提供正在使用的Virtuoso版本?

问候

休威廉姆斯

OpenLink的软件

+1

嗨休, 我在Ubuntu盒子上使用6.01.3127(开源版本)。其实,我对Virtuoso的观察不是基于数字,而是我个人的感觉。 该图加载了最新的DBPedia数据集(3.5.1),然后通过PHP中的cURL绑定(本地)在SPARQL端点上进行查询。我实现了一个简单而经典的广度优先搜索,目标是找到2个节点之间的最短路径的长度。 那么你有什么建议?谢谢你的时间。 – parsa 2010-08-22 09:27:23

+1

/@ parsa - 为了将来的参考,SO答案不打算作为讨论论坛。 – 2011-06-05 22:29:06

0

我想看看源代码和数据文件和配置文件提供任何提示之前。由于诸如缺少索引或配置设置之类的琐事,获得500倍的性能差异并不罕见。你能否提供更多的细节,可能通过Virtuoso Users mail list