2013-07-16 49 views
-2

这是一个拉丁问题。我的数据有3个字段如下:通过比较线与其他线可以PIG过滤器?

usrid时间距离

020204 9时23分45秒350.1103

020204 9点29分48秒350.1522

222292 14时01分34秒1.992134

我想删除一条线,如果有另一条线具有相同的usrid,这样两条线之间的时间间隔小于10分钟。例如,第2行必须删除,因为第1行的usrid相同,第2行之间的时间间隔仅为〜6分钟。

回答