2017-10-20 39 views
0

创建Hadoop作业时,会为其分配唯一的ID。例如,我刚刚运行了一个ID为job_201709221002_0046的工作。看起来第一部分是某种时间戳,但这不是提交工作的日期。下划线之后的部分似乎是连续的。 这是什么意思?Hadoop作业ID是什么意思?

编辑:我正在看的工作是一周。我刚刚在2017年10月20日星期五上午12点22分3秒提交了一份新表,并分配了工作编号job_201709221002_0047

+0

开始被日提交哪些材料?这可以澄清事情。我会说像UTC提交的日期? –

回答

2

表示当JobTracker的是started.In你的情况job_201709221002_0047它在JobTracker的运行第47工作,这在201709221002

Source

作业ID代表不可改变的唯一标识符的时间开始的时间为了工作。 JobID由两部分组成。第一部分表示jobtracker标识符,以便定义JobID到jobtracker映射。对于集群设置,该字符串是jobtracker的开始时间,对于本地设置,它是“本地”。 JobID的第二部分是工作号码。

一个例子作业ID是:job_200707121733_0003,它代表了第三份工作在JobTracker的运行在200707121733.