2012-09-17 37 views
0

我有一个小的hadoop/hive集群(共6个节点)。 使用“hadoop dfsadmin -report”我看到,datanodes工作正常并且连接。 此外,当我将数据添加到配置单元表中时,我可以看到数据在整个节点上分布为 。 (容易检查,因为使用的磁盘空间增加)。Hadoop/Hive集群。只有一个节点利用率

我想在一张桌子上创建一些索引。从jobtracker http界面,我看到只有一个节点可用。我试图运行多个查询(我使用mysql作为元数据),但它们似乎只在安装配置单元的节点上运行。

基本上我的问题是如何让jobtracker利用其他节点。

回答

0

从你告诉它看起来是:
的Datanode正确的所有节点上运行,并且能够与NameNode的通信。
任务跟踪器在除一个节点之外的所有节点上未运行,或者出于某种原因无法与作业跟踪器通信。
在检查完任务跟踪器确实正在运行后 - 阅读他们的日志以找出他们与JobTracker进行通信的问题。

+0

你说得对。我没有注意到它,但jobtracker在节点上失败。 失败的原因是愚蠢的(作业追踪器日志文件夹上的用户权限)。我没有注意到它,尽管一切都在运行。 现在修复它,一切正常。 – user1676389

+0

只有小修正 - 在节点上运行的deamons是TaskTracker的不是JobTracker –