我有一台Apache Hadoop 1.1.1的单节点实例,它具有大量内存和非常有限的可用磁盘空间大小的计算机上的默认参数值(请参阅例如[1]和 [2]) 。然后,我注意到这个Hadoop实例在映射任务期间浪费了大量磁盘空间。为了利用高容量RAM和减少磁盘空间使用量,我应该注意哪些配置参数?高内存计算机上的Hadoop单节点配置
1
A
回答
2
您可以使用几个mapred。*参数压缩映射输出,这将大大减少存储映射器输出所需的磁盘空间量。请参阅this question了解一些好的指针。
请注意,不同的压缩编解码器会有不同的问题(即GZip需要比LZO更多的CPU,但您必须自己安装LZO)。 This page对Hadoop中的压缩问题进行了很好的讨论,尽管它有点过时。
的RAM,你需要的金额取决于你在你的地图,减少工作在做什么,虽然可以增加你堆大小:
conf/mapred-site.xml mapred.map.child.java.opts
更多这方面的详细信息,请参见cluster setup。
0
您可以在hdfs-site.xml中使用dfs.datanode.du.reserved
来指定您不会使用的磁盘空间量。我不知道hadoop是否能够补偿更高的内存使用量。
但是,如果您运行磁盘I/O密集型的mapreduce作业,则会出现问题。我认为任何数量的配置都不会对你有所帮助。
相关问题
- 1. 单节点配置运行Hadoop
- 2. hadoop单节点设置
- 3. 在计算机上的Ram配置
- 4. Hadoop节点高可用性
- 5. 什么消耗Hadoop YARN中的计算机内存?
- 6. unbuntu下的单节点Hadoop设置12.0.04
- 7. 单节点的Hadoop设置unbuntu 10.04
- 8. 将Hadoop配置为多节点群集
- 9. Hadoop客户端节点配置
- 10. hadoop 2.7.1 - 配置辅助名称节点
- 11. F#计算三元节点的高度
- 12. Hadoop Datanode配置内核和内存
- 13. 节点主机配置
- 14. Hadoop机器配置
- 15. 客户机上的hadoop api配置
- 16. hadoop集群配置 - dfsnodelist上的节点显示为localhost
- 17. 更改Hadoop从节点上的默认配置?
- 18. Hadoop单节点集群设置问题
- 19. 的Hadoop 2.6.1单节点设置:数据节点未启动
- 20. 扫描计算机内存
- 21. 枚举计算机内存
- 22. Hadoop&Hbase安装和配置窗口上单个节点集群中的问题
- 23. Hadoop名称节点HA配置单元故障
- 24. 我可以在配置多节点后使用单节点配置吗我说的是hadoop
- 25. 使用Hadoop的高性能计算机的成本效益
- 26. Openshift节点存储配置
- 27. mongodb单节点配置
- 28. 在Hadoop 1.2.0中配置作业内存
- 29. 内存位置计算
- 30. hadoop单节点设置bash:bin/hadoop权限被拒绝