HDFS fsimage和editlog写入多个位置,包括NFS挂载。
A)的NameNode守护程序崩溃: 解决方案: 刚刚重新启动的Namenode过程
B)主机关闭命名节点运行的位置。
解决方案:
- 与空dfs.name.dir
- 点dfs.name.dir到NFS挂载,我们有元数据的副本开始在不同的主机名称节点。 或
- 使用--importCheckpoint选项同时指出fs.checkpoint.dir后开始的NameNode从二级NameNode的
- 更改fs.default.name到备份主机名URI检查点目录并重新启动集群与所有的奴隶IP在从属文件中。
注 - 我们可能会错过上次检查点后可能发生的编辑。
方案2:
的HDFS的FsImage被写入一个目录中。
A)的NameNode守护程序崩溃: 解决方案:未知
B)主机已关闭命名节点运行的位置。
解决方案:
- 创建指向dfs.name.dir在目录中的一个空白目录(1)
- 启动的Namenode与-importCheckpoint指向fs.checkpoint.dir从二级目录设置检查点后NameNode的
- 更改fs.default.name到备份主机名URI并重新启动集群的所有从IP的奴隶文件。
这种方式,我们会再次错过最后一个检查点之后编辑的文件。
请让我知道,如果这是我们如何能够手动恢复集群。
你可以编辑你的文章,包括一个正确的问题吗?我不确定你在问什么。如果您有它们,发布一些日志文件片段也会很有帮助。它会帮助我诊断你的问题。谢谢 – 2012-03-15 02:00:53
我正在给一些生产场景。在情景1和情景2的情况下要做什么。为了获得不同的名称节点恢复技术 – Jagaran 2012-03-15 03:30:47
现在改变了问题 – Jagaran 2012-03-15 03:51:45