2014-04-03 20 views
0

我有如下的输入数据格式来表示传出链路从源URL即源URL 1页具有图2页3出射的URL猪模式来加载数据

1 2 3 
2 3 4 
3 4 
4 1 

而且我想加载到猪如下

N, aN 
(1,(2,3)) 
(2,(3,4)) 
(3,(4)) 
(4,(1)) 

我能做到这一点使用默认的AS架构或我是否需要写一个自定义的加载功能。

+0

请您介绍一下输入格式中的列是什么意思?对于'3 4'这一行,这是否意味着3只与4相邻(假设这是指向的)? – mr2ert

+0

我编辑了关于输入格式的描述。 {3 4}表示4是来自3. – Abhilash

回答

0

您需要编写自定义加载程序或修改您的数据结构。如果没有自定义加载程序,可以将其转换为以下格式:

N, aN 
(1,(2,3)) 
(2,(3,4)) 
(,(3,4)) 
(,(4,1)) 
+0

的传出链接感谢您的回复。以前我的预期格式是错误的,我编辑过它。你能再看看这个吗?基本上,该行中的第一个数字是源URL,其余的是来自此源URL的链接,它们可以是1到多个。 – Abhilash