假设您有4个节点n1,n2,n3和n4。 您可以在分布式模式下安装hadoop和hbase。 如果您正在使用Hadoop 1.x的 -
n1 - hadoop master[Namenode and Jobtracker]
n2, n3 and n3 - hadoop slaves [datanodes and tasktrackers]
对于HBase的,你可以选择N1或任何其他节点作为主节点,由于主节点通常不是CPU /内存密集型,都是高手可以部署在单节点,但是在生产环境中,每个主节点都可以在单独的节点上部署。
Lets say n2 - HBase Master, remaining 3 nodes can act as regionservers.
Hive和Nutch可以驻留在任何节点上。 希望这有助于;对于测试设置,这应该是好的。
更新 -
Hadoop的2.x的,因为你的簇大小小,Namenode会HA部署可以跳过。 Namenode HA将需要两个节点分别用于活动和备用节点。
动物园管理员法定人数再次需要奇数个节点,因此至少需要三个节点。
日记仲裁还需要最少3个节点。
但是对于一个集群来说,这个小的HA可能不是一个主要的问题。所以,你可以保持
N1 - NameNode的
N2 - ResouceManager或纱线
和其余的节点可以充当数据节点,尽量不要部署纱节点上的任何东西。
HBase,Hive和Nutch的其余部署将保持不变。
我的Hadoop版本的详细指导2.x的 – Shafiq 2014-11-05 13:42:15
这是你的测试设置? – mbaxi 2014-11-05 15:14:07
不,它不仅仅用于测试,而且还用于实际使用 – Shafiq 2014-11-06 04:07:20