2013-10-31 31 views
0

让我们假设我有一个日志文件,但没有日期字段或可用于排序的任何其他字段。唯一的提示是文件中的行已经排序(但是例如我需要下降排序而不是上升) 我想要做的是在使用Pig加载时为每行生成一个有效的ID。 是否有我可以使用的内置变量? 像RowId的东西?使用猪加载时为每行添加ID

你有什么想法吗?

问候, 帕维尔

回答

2

New in Pig 0.11RANK运营商,这将完成你需要做什么。

+0

谢谢,这是我需要的。 –