2015-05-01 28 views
0

我有数据记录是这样的:Apache PIG - 如何获得翻牌10数据记录?

Name   customerID revenue(Mio) premium   
Michael James 078932832 2.7   y 
Susan Miller 024383490 3.9   n 
John Cooper 021023023 2.1   y 

如何获得这些记录 - 分为优质标志 - 每一个最低收入(=触发器10)?正如你所看到的列表进行排序上升(与最低收入开始)

Nr Name   customerID revenue(Mio) premium   
1 John Cooper 021023023 2.1   y 
2 Michael James 078932832 2.7   y 
3 Andrew Murs 044834399 3.0   y 
. ...   .....  ...   . 
10 th entry  with  flag   y 

1 Susan Miller 024383490 3.9   n 
. ...   .....  ...   . 
10 th entry  with  flag   n 

结果应给出。

+0

你已经试过了什么? – mr2ert

回答

0

我猜你应该使用拆分 考虑是你的负担声明

A = load 'data' as (Nr,Name,customerID,revenue,premium); 
B = split A into PRE if premium =='y', NONPRE if premium == 'n'; 
C = order PRE by revenue asc; 
D = order NONPRE by revenue asc; 

免责声明:小心,同时采用分体式为空的记录会被丢弃。我没有编译这个代码。

+0

非常感谢!我会测试它。但我怎样才能在一个文件中得到两个不同的结果?# –

+0

E = UNION C,D;转储E; –