2013-10-17 35 views
0

我写了一个Pig脚本,并希望在Hadoop集群上执行它。我如何测量总处理时间?是否有任何命令可以从开始到结束处理时间?猪的性能测量

回答

1

编辑:增加了time替代。

要知道需要多长时间(以秒为单位):

time pig <options> 

另一种方式来做到这一点:

d1=$(date +%s) 
pig <options> 
d2=$(date +%s) 
echo "$d2 - $d1" | bc 

或者,在一个单行:

d1=$(date +%s) ; pig <options> ; d2=$(date +%s) ; echo "$d2 - $d1" | bc 

你也可以只看一下猪的产量。当您运行在命令行脚本猪,对输出的末尾,你会看到:

HadoopVersion PigVersion UserId StartedAt FinishedAt Features 
... 

然后,您可以减去FinishedAt - StartedAt

+2

你的第二个方法是我会做的,但是对于第一个,为什么不使用'time'? –

+0

@WinnieNicklaus你说得对,就是这样做。我刚刚给我的答案加了'时间'。 – cabad