-2
这是一个拉丁问题。我的数据有3个字段如下:通过比较线与其他线可以PIG过滤器?
usrid时间距离
020204 9时23分45秒350.1103
020204 9点29分48秒350.1522
222292 14时01分34秒1.992134
我想删除一条线,如果有另一条线具有相同的usrid,这样两条线之间的时间间隔小于10分钟。例如,第2行必须删除,因为第1行的usrid相同,第2行之间的时间间隔仅为〜6分钟。