2013-09-30 66 views
0

我想分析Hive查询的性能。尽管我能够用Java进行Hive查询,但我仍然需要访问每次查询后生成的日志信息。而不是使用黑客来读取磁盘上的最新日志,并使用正则表达式来提取数字,我正在寻找一个优雅的方法,如果已经可用。如何访问Hive日志信息

任何指针都会有帮助。提前致谢。

-LG

回答

0

一旦蜂巢开始运行相应的地图,减少作业启动相关信息。这个hadoop作业的日志可以在每个任务运行的相应任务跟踪器上找到。

使用jobclient API以编程方式检索这些日志。

+0

谢谢KS。我是按照相同的方法,但目前卡住的例外:“线程中的异常”main“java.lang.NoClassDefFoundError:org/codehaus/jackson/map/JsonMappingException”。它在创建JobClient的对象时发生。我把所有杰克逊罐子都提供给我的java程序,但仍然没有运气。他们是否被放置在Hive系统上? – lex