0
我写了一个Pig脚本,并希望在Hadoop集群上执行它。我如何测量总处理时间?是否有任何命令可以从开始到结束处理时间?猪的性能测量
我写了一个Pig脚本,并希望在Hadoop集群上执行它。我如何测量总处理时间?是否有任何命令可以从开始到结束处理时间?猪的性能测量
编辑:增加了time
替代。
要知道需要多长时间(以秒为单位):
time pig <options>
另一种方式来做到这一点:
d1=$(date +%s)
pig <options>
d2=$(date +%s)
echo "$d2 - $d1" | bc
或者,在一个单行:
d1=$(date +%s) ; pig <options> ; d2=$(date +%s) ; echo "$d2 - $d1" | bc
你也可以只看一下猪的产量。当您运行在命令行脚本猪,对输出的末尾,你会看到:
HadoopVersion PigVersion UserId StartedAt FinishedAt Features
...
然后,您可以减去FinishedAt - StartedAt
。
你的第二个方法是我会做的,但是对于第一个,为什么不使用'time'? –
@WinnieNicklaus你说得对,就是这样做。我刚刚给我的答案加了'时间'。 – cabad