2012-12-21 64 views
1

我有两个文件。我想顺序合并它。我如何使用Pig/PigLatin脚本来做到这一点?如何使用PIG脚本合并两个文件?

f1.csv 
1,aa 
1,aa 
1,ab 
1,ac 
2,bd 
2,bd 
2,bd 
4,ab 
4,bc 

f2.csv 
1,xxx 
1,xxy 
1,xyx 
1,yxx 
1,xyy 
1,yyx 
2,pqr 
2,pq 
2,pqrs 
2,pqs 
3,def 

和输出我需要的是

1,aa,1,xxy 
1,aa,1,xyx 
1,ab,1,yxx 
1,ac,1,xyy 
2,bd,2,pqr 
2,bd,2,pq 
2,bd,2,pqrs 

谁能帮助我该加入应使用以及如何获得呢?

+1

http://pig.apache.org/docs/r0.10.0/basic.html#join-inner - 我认为这个例子几乎涵盖了它,但是你的预期输出将会有第一场配对的每个组合 - 你似乎在要求有些不同,或者你的预期产出是不完整的? (将有24配对的第一个字段值1) –

+0

我认为这将需要一个自定义输入格式 –

+0

请解释更多。 '1,xxx'等等发生了什么?你的(精神)算法是什么? –

回答