我是Hadoop,HBase和Hive的新手。我以伪分布模式安装Hadoop,HBase和Hive,一切正常。 现在我打算用Hive,HBase和ZooKeeper建立一个简单的Hadoop集群(5个节点)。我之前已经阅读过几份文件和说明,但我无法找到解决我的问题的好方法。我不确定,在哪里运行所有的守护进程。这是我的考虑:配置Hadoop,HBase和Hive集群
Node_1(主)
- 的NameNode
- JobTrakcer
- HBase的主
动物园管理员(独立节点;通过HBase的管理)
Node_2(Backup_Master)
SecondaryNameNode
Node_3上(SLAVE1)
- DataNode1
- TaskTracker1
RegionServer1
Node_4上(SLAVE2)
- DataNode2
- 的TaskTracker 2
RegionServer2
Node_5上(Slave3)
- DataNode3
- TaskTracker3
- RegionServer3
我知道,在生产中,建议在奇数节点(单独的集群)中运行的ZooKeeper合奏。但是对于一个简单的集群,可以设置一个在主节点上运行的独立ZooKeeper节点吗?
另一个问题是关于Hive:我知道Hive是一个Hadoop客户端。我是否也应该在主节点上安装Hive?是否有意义?
感谢您的所有提示和意见! Hakan
注:我只有5台机器来模拟群集。
这与您的问题无关,但我想向您指出SecondaryNameNode是* not *备份NameNode。这是一个常见的错误,但这不是SecondaryNameNode的目的。如果你想简单地备份,你应该考虑拥有一个被动/主动NameNode。来源:http://wiki.apache.org/hadoop/FAQ#What_is_the_purpose_of_the_secondary_name-node.3F –
感谢您的提示埃里克! **没有人可以帮我解决我的问题吗?这真的很紧急.. ** – user1818390