2015-05-08 13 views
-1

我使用SNAP facebook数据集进行社交网络分析。 SNAP使用简单的边界列表作为数据格式“node1 node2”。我如何阅读Apache Giraph中的SNAP数据集?我正在使用BufferedReader每行读取文件,但不知道如何使用邻接列表将其保存在BSP模型中。有人可以帮我在java中的代码示例 我还想添加有关节点的信息(每个用户/节点的特征)我怎么能在Giraph中做到这一点?导入/保存SNAP Facebook边缘在Apache Giraph

回答

0

您可以直接使用SNAP facebook数据集。在你的命令中,不要使用-vif ...使用-eif org.apache.giraph.io.formats.IntNullTextEdgeInputFormat。这种格式将每行读取为(source_vertex destination_vertex),就像SNAP数据集一样。

+0

对于命令:./hadoop jar /usr/local/giraph-1.1.0/giraph-examples/target/giraph-examples-1.1.0-for-hadoop-2.5.1-jar-with-dependencies.jar org.apache.giraph.GiraphRunner org.apache.giraph.examples.SimpleShortestPathsComputation -eif org.apache.giraph.io.formats.IntNullTextEdgeInputFormat -vip /user/hduser/input/facebook/0.edges -vof org.apache.giraph .io.formats.IdWithValueTextOutputFormat -op/user/hduser/output /最短路径-w 1我得到IllegalArgument错误 – anu

+0

使用-ip而不是-vip –

+0

./hadoop jar /usr/local/giraph-1.1.0/giraph- examples/target/giraph-examples-1.1.0-for-hadoop-2.5.1-jar -with-dependencies.jar org.apache.giraph.GiraphRunner org.apache.giraph.examples.SimpleShortestPathsComputation -eif org.apache .giraph.io.formats.IntNullTextEdgeInputFormat -eip /user/hduser/input/facebook/0.edges -vof org.apache.giraph.io.formats.Id WithValueTextOutputFormat -op/user/hduser/output /最短路径-w 1 –