0
在我的MR作业中,使用HFileOutputFormat进行批量加载时,会生成87个地图任务,并且在大约20分钟内所有任务都达到100%。然而,单个任务状态仍处于hadoop管理页面的“正在运行”状态,并且没有任何状态转移到完成状态。减速机始终处于挂起状态,从不启动。我只是在等待,但在30分钟超时后出现错误。所有地图任务达到100%,但仍处于运行状态
我的工作必须加载大约150列。我尝试用较少的列数运行相同的MR作业,并轻松完成。任何想法为什么地图任务即使在达到100%后也不会移至完成状态?
你能告诉我们日志吗? – Tariq
您是否配置了组合器?从地图阶段输出多少条记录,您是否有一个减速器? –
未配置组合器。是的,HFileOutputFormat的一个默认的putsort reducer应该运行。 9百万条记录 – RGC