我一直在尝试从HDFS加载文件并使用Dump检查输出。但我没有得到欲望的输出。我的输入文件( '/结果')是这样的:PIG负载没有给出正确的输出
1 fail
2 fail
3 pass
4 pass
5 fail
6 pass
7 fail
8 pass
9 pass
10 pass
11 pass
12 fail
13 fail
14 fail
15 pass
16 pass
17 pass
18 pass
19 pass
20 fail
这猪命令我编码:
A = LOAD '/results' using PigStorage() as (f1:int, f2:chararray);
Dump A;
但我得到的输出如下:
(1,fail)
(,)
(2,fail)
(,)
(3,pass)
(,)
(4,pass)
(,)
(5,fail)
(,)
(6,pass)
(,)
(7,fail)
(,)
(8,pass)
(,)
(9,pass)
(,)
(10,pass)
(,)
(11,pass)
(,)
(12,fail)
(,)
(13,fail)
(,)
(14,fail)
(,)
(15,pass)
(,)
(16,pass)
(,)
(17,pass)
(,)
(18,pass)
(,)
(19,pass)
(,)
(20,fail)
我真的不明白从哪里来“(,)”已经到了两个元组之间。有人可以帮我吗 ?
谢谢。
非常感谢!有效 – Sri