2016-11-10 125 views
1

我有hadoop集群。现在我想在另一台机器上安装猪和蜂巢作为客户端。客户端机器不会成为该群集的一部分,因此可能吗?如果可能的话,我如何将该客户机连接到集群?Hadoop集群和客户端连接

回答

0

首先,如果你有Hadoop集群,那么你必须拥有主节点(Namenode会)+从节点(数据节点)

的一个另一件事是客户端节点。 Hadoop集群的工作是: Hadoop Cluster

这里的Namenode和Datanode的形成运行Hadoop集群,客户端提交作业的Namenode。

为了达到这个目的,客户端应该有相同的Hadoop分发和配置副本,它存在于Namenode中。 然后,只有客户端才会知道Job跟踪器正在运行的节点,以及Namenode的IP访问HDFS数据。

有关客户端配置,请转至Link1Link2

根据你的问题

完整的Hadoop集群配置(主+从+客户端)之后。你需要做以下步骤:

  1. 在主节点上安装Hive和Pig
  2. 在客户端节点上安装Hive和Pig
  3. 立即开始客户端节点上编码猪/蜂巢。

如果有疑问,请随时发表评论.... !!!!!!

+0

谢谢安库尔先生。我还有一个疑问。如果我必须使用Hadoop集群的R工具,那我该怎么办? –

+0

如果你有回答上述问题。标记为正确答案。 –

+0

您需要在群集上安装RHadoop,以便将R工具与Hadoop群集相连。 –