0
我们的CDH群集上有5个节点,datanode和namenode在同一个节点上,还有4个其他datanode。问题是名称节点进入安全模式,并且应该由于磁盘空间不足而发生。我删除了datanode机器上的datanaode角色。我想知道在这个节点上存储的数据是否通过其他4台机器自动平衡?如果在hadoop群集中删除了datanode角色,数据是否会自动迁移到其他节点?
我们的CDH群集上有5个节点,datanode和namenode在同一个节点上,还有4个其他datanode。问题是名称节点进入安全模式,并且应该由于磁盘空间不足而发生。我删除了datanode机器上的datanaode角色。我想知道在这个节点上存储的数据是否通过其他4台机器自动平衡?如果在hadoop群集中删除了datanode角色,数据是否会自动迁移到其他节点?
没有一个普遍的答案,但通常如果数据节点被删除(故障,故意等),错过的块应该被标识为欠复制,并且名称节点应该开始向数据节点发送指令以从副本中复制副本,直到所有块都具有所有需要的副本。假设默认副本参数设置为3,并且至少每个缺失块都有一个块,则群集将自动创建分布在可用数据节点上的所需副本。