2015-09-20 84 views
1

我想将大型数据集导入到本地Neo4j实例中。我正在尝试使用导入工具,但目前为止没有成功。使用导入工具将TSV数据导入到Neo4j中

由于我的数据量很大,我无法使用Cypher或“LOAD CSV WITH HEADERS”方法(我的数据也没有标题)。

我试图用以下语句导入工具:

neo4jimport --into C:\...\my_database --nodes C:\...\Authors_header.csv,C:\...\Authors.csv --stacktrace --delimeter TAB 

我的文件是一个.CSV文件,但该值是制表符分隔。我的头文件格式:

authorID author_name 

我的主(虚拟实例)文件的样子:

1 Banana 
2 Apple 
3 Pear 
4 Potato 
5 Tomato 

我尝试了虚拟文件用逗号与分号和方法工作得很好,但使用选项卡这两个属性获得合并成一个,所以导入后,我有一个名为只有一个属性节点:

authorID author_name 

由于我的文件的大小,我不能只是用逗号代替TABS。我尝试将分隔符更改为'\ t'和其他组合,但没有去。

另外我想知道是否可以添加一个静态标签,当它被创建时,即使标签不是从数据文件中读取。

我正在考虑使用不同的方法,如果导入工具没有把它拉入Python和py2neo。

我在普通的便携式机器上使用Neo4j 2.2.3社区版。

任何帮助将不胜感激。

回答

3

你有一个错字:它不是delimeterdelimiter,看到neo4jimport --help

更新到2.2.5获得最高性能的最新版本。

你的标题也许应该是:

authorID:ID author_name

,你也应该提供--id-type integer

您可以在命令行中的所有节点提供一个标签:--nodes:Author

+0

我恨它当发生这种情况(打字错误)时,花了整个下午。感谢您的快速回复 - 像魅力一样。 – user3745794