2016-08-17 28 views
0

我有以下CSV文件:Dse的图形装载机重复边缘

一个是与人,另一种是与地址和一个与人的地址连接(每个文件加一个标题行)。在第一次运行测试目的,我有:

配置create_schema:真,load_new:真,load_threads:3

进口与顶点和边成功。 (两个顶点和它们之间的一个边缘)

现在,当我运行相同的脚本(相同的数据,相同的输入脚本),但具有不同的配置

配置create_schema:假,load_new:假,load_threads:3

看来,节点没有改变,但我有一个重复的边缘节点。 (两个顶点和相同的节点之间的两条边)

这是我运行的代码:

inputfiledir = 'data/' 
personInput = File.csv(inputfiledir + 'sna_person_test.csv').delimiter(',') 
addressInput = File.csv(inputfiledir + 'sna_address_test.csv').delimiter(',') 
personAddressInput = File.csv(inputfiledir + 'san_person_address_test.csv').delimiter(',') 

load(personInput).asVertices { 
    label "person" 
    key "id" 
} 

load(addressInput).asVertices { 
    label "address" 
    key "id" 
} 

load(personAddressInput).asEdges { 
    label "has_address" 
    outV "person_id", { 
     label "person" 
     key "id" 
    } 
    inV "address_id", { 
     label "address" 
     key "id" 
    } 
} 

是否有办法避免这种情况?

由于

回答

1

这是由于不具有ID,这导致格拉夫装载机不具有方法来确定是否一个边缘实际上重复的边缘。这将导致后续加载复制边缘,而不是顶点。