0
在Hadoop集群上,我们需要在DataNode还是Namenode上安装Hive? 我们需要决定安装节点的哪个因素(Datanode或Namenode)何处安装Hive(在DataNode或Namenode上)以及为什么?
谢谢!
在Hadoop集群上,我们需要在DataNode还是Namenode上安装Hive? 我们需要决定安装节点的哪个因素(Datanode或Namenode)何处安装Hive(在DataNode或Namenode上)以及为什么?
谢谢!
配置单元的安装与它驻留在namenode或datanode上的事实无关。 Hive配置文件需要知道hadoop的安装位置,以便它可以访问作业跟踪器。
一旦知道了作业跟踪器的运行位置,无论何时在Hive中执行查询,它都会将您的查询转换为一个或多个mapreduce程序,然后将该程序提交给hadoop的jobtracker。然后Jobtracker执行这个map reduce程序并显示/存储输出。
非常感谢您的回答。我们是否需要在每个datanode上安装配置单元。最佳做法是什么? – AshHadoopExpert
不,最好的方法是在要提交作业的节点上安装配置单元https://stackoverflow.com/questions/8456141/in-a-hadoop-cluster-should-hive-be-installed-on - 全节点 – gonephishing