我想使用tdbloader将YAGO 3 rdf三元组(yago3_entire_ttl.7z从http://www.mpi-inf.mpg.de/departments/databases-and-information-systems/research/yago-naga/yago/downloads/)用到apache-jena triplestore(3.1.0)。在加载到Apache-jena TDB triplestore之前清理YAGO文件
由Apache的设置Jena的验证输入的防暴工具提供2种类型的错误(多次出现):
- 非法Unicode转义序列值:\\(0x5C)在IRI
- 非法字符(代码点0x7C,'|')
我明显的想法是用'\'和'|'代替。与接受的字符序列,通过暴乱验证,但我想知道是否有其他解决方案?
同样的问题在这里,任何想法? – n1try
不是一个解决方案,而是我的解决方法:我最终将Openlink的Virtuoso的开源版本与jena库一起用作triplestore。在Centos Linux 7上导入670Mio三元组没有问题。 –