我想分析Hive查询的性能。尽管我能够用Java进行Hive查询,但我仍然需要访问每次查询后生成的日志信息。而不是使用黑客来读取磁盘上的最新日志,并使用正则表达式来提取数字,我正在寻找一个优雅的方法,如果已经可用。如何访问Hive日志信息
任何指针都会有帮助。提前致谢。
-LG
我想分析Hive查询的性能。尽管我能够用Java进行Hive查询,但我仍然需要访问每次查询后生成的日志信息。而不是使用黑客来读取磁盘上的最新日志,并使用正则表达式来提取数字,我正在寻找一个优雅的方法,如果已经可用。如何访问Hive日志信息
任何指针都会有帮助。提前致谢。
-LG
查询执行的细节,如状态,在完成,完成了显示在作业跟踪器,您可以通过编程访问作业服务器。在这个环节
一旦蜂巢开始运行相应的地图,减少作业启动相关信息。这个hadoop作业的日志可以在每个任务运行的相应任务跟踪器上找到。
使用jobclient API以编程方式检索这些日志。
谢谢KS。我是按照相同的方法,但目前卡住的例外:“线程中的异常”main“java.lang.NoClassDefFoundError:org/codehaus/jackson/map/JsonMappingException”。它在创建JobClient的对象时发生。我把所有杰克逊罐子都提供给我的java程序,但仍然没有运气。他们是否被放置在Hive系统上? – lex