0
让我们假设我有一个日志文件,但没有日期字段或可用于排序的任何其他字段。唯一的提示是文件中的行已经排序(但是例如我需要下降排序而不是上升) 我想要做的是在使用Pig加载时为每行生成一个有效的ID。 是否有我可以使用的内置变量? 像RowId的东西?使用猪加载时为每行添加ID
你有什么想法吗?
问候, 帕维尔
让我们假设我有一个日志文件,但没有日期字段或可用于排序的任何其他字段。唯一的提示是文件中的行已经排序(但是例如我需要下降排序而不是上升) 我想要做的是在使用Pig加载时为每行生成一个有效的ID。 是否有我可以使用的内置变量? 像RowId的东西?使用猪加载时为每行添加ID
你有什么想法吗?
问候, 帕维尔
New in Pig 0.11是RANK
运营商,这将完成你需要做什么。
谢谢,这是我需要的。 –