我在hadoop集群上运行Hive作业。我只是开始知道,如果你只专注于不同的行为映射器和减速器,性能将得到改善/改变。但直到我还没有玩过它。直到没有我玩过Hive并使用默认的mapper和reducer执行查询?在hadoop中执行作业时如何设置Mapper和Reducer以及如何决定?
正如我所了解的mapper和reducer一样,我很担心要设置mapper和reducer的值,以使性能得到改变。我也认为它只需要设置为主节点,或者我们必须为所有节点设置?
任何有想法的人都可以解释一下我的情况。
另外我们在执行作业时需要设置哪些其他参数?
你的意思是设置映射器和减压器多少? –
是。其实我试图设置它,但它并没有反映在各自的工作XML文件。每个作业创建它自己的XML文件。纠正我我错了。我检查我的日志,我找到了所有的环境变量,我hadoop设置在各自的XML中。 在哪里触发te命令来设置这些变量(设置mapred.map.tasks,.....)? am设置在/home/hadoop/hive-0.7.1/bin/hive -e'set mapred.map.tasks'?它是否正确? –