猪的性能测量

我写了一个Pig脚本，并希望在Hadoop集群上执行它。我如何测量总处理时间？是否有任何命令可以从开始到结束处理时间？猪的性能测量

2013-10-17 Reza

编辑：增加了time替代。

要知道需要多长时间（以秒为单位）：

time pig <options>

另一种方式来做到这一点：

d1=$(date +%s) 
pig <options> 
d2=$(date +%s) 
echo "$d2 - $d1" | bc

或者，在一个单行：

d1=$(date +%s) ; pig <options> ; d2=$(date +%s) ; echo "$d2 - $d1" | bc

你也可以只看一下猪的产量。当您运行在命令行脚本猪，对输出的末尾，你会看到：

HadoopVersion PigVersion UserId StartedAt FinishedAt Features 
...

然后，您可以减去FinishedAt - StartedAt。

2013-10-17 19:06:08 cabad

你的第二个方法是我会做的，但是对于第一个，为什么不使用'time'？ –

@WinnieNicklaus你说得对，就是这样做。我刚刚给我的答案加了'时间'。 – cabad

回答