0
在我mrjob.conf我做了额外的音量设置:亚马逊EMR:当连接EBS卷到实例如何确保这个量是用来
Instances.InstanceGroups.member.2.EbsConfiguration.EbsBlockDeviceConfigs.member.1.VolumeSpecification.SizeInGB: 250
Instances.InstanceGroups.member.2.EbsConfiguration.EbsBlockDeviceConfigs.member.1.VolumeSpecification.VolumeType: gp2
Instances.InstanceGroups.member.2.EbsConfiguration.EbsBlockDeviceConfigs.member.1.VolumesPerInstance: 1
当我运行在群集我见对于每个实例,我都有10GB和250GB的卷。但EMR是否使用250GB存储空间来保存数据?如果不是如何使它工作?
我会提醒的是,EMR的最佳建议是在可能的情况下实际使用EMRFS - 即直接将S3挂载为HDFS挂载点。在你的情况,是的,我相信它会自动拿起250 GB硬盘作为HDFS写入空间? EMR使用250GB存储来保存数据吗? – Henry
,哪种数据以及谁在生成数据? –