我是hadoop mapreduce的新手。我想开发mapreduce代码来转换一个小文件的文本文件,但以前面的文件序列。这意味着在文件的实际顺序,而不是类似于wordcount数据序列。所以可以给我什么想法?如何在Hadoop中只包含案例?
0
A
回答
1
仅有逐行读取文件中的行和然后发射它作为关键值< < LineNumber上,UPPERCASEOFLINE >>,所以每一行的上壳将成为减速器的值(A列表只有一个元素) 。
现在,所有你需要做的是发出的值(每个键单线)作还原剂的关键,你可以使减速器值为NullWritable。
LineNumber在映射程序中,从1开始每增加1行输入一次。 还重写isSplitable()以返回false,以使一个文件完全由一个映射器处理。
+0
还需要编写客户记录阅读器吗? – FourOfAKind 2012-10-07 21:45:17
0
我在通过hadoop map reduce程序将给定文本转换为大写的同时面临同样的问题。
follwing是我的减速器代码段
public static class UpperCaseReducer extends MapReduceBase implements Reducer<Text,Text,Text,Text>
{
public void reduce(Text key,Iterator<Text> value,OutputCollector<Text, Text> output,Reporter rporter) throws IOException
{
//while(value.hasNext())
{
String NULL= new String();
//System.out.println(value.toString());
output.collect(value.next(),new Text(""));
}
}
}
以我映射器代码,我只读取输入的文本行,并通过线作为其转换成上壳体和使所述原始行键和转换的文本作为我的映射器方法的值作为输出。
相关问题
- 1. 如何在宏中包含唯一匹配案例的文档?
- 2. 如何在Hadoop流媒体作业中包含python包?
- 3. 如何在PHP中包含档案中心档案
- 4. HTML输入图案验证如果串只包含图案
- 5. hadoop的使用案例
- 6. 方案:返回只包含LST
- 7. ImageView包含图像的案例检查
- 8. 在Hadoop中包含第三方Jars
- 9. Playframework:如何将JSON绑定到包含地图的案例类?
- 10. 如何在Hive中包含jar(Amazon Hadoop env)
- 11. Hadoop:如何在Python中包含第三方库MapReduce
- 12. 如何在DB2选择案例中包含来自不同表的选择
- 13. 如何只包含文件存在
- 14. 如何在包中包含示例或测试程序?
- 15. 在java档案中包含文件
- 16. 如何在解决方案中包含快捷方式(.lnk)?
- 17. 如何在我的Java解决方案中包含servlet-api.jar?
- 18. hadoop,如何在尝试运行mapred作业时包含3part jar
- 19. SQL Server 2000如何在案例陈述中形成案例?
- 20. 如何使用javascript在切换案例中调用案例?
- 21. 更改oracle中自定义列的名称包含案例
- 22. 如何只包含汇编包含文件的部分
- 23. 如何在VSTS中只包含一个构建步骤来打包混合项目解决方案?
- 24. 如何包含在Symfony2中
- 25. 如何在Odoo中包含?
- 26. 如何在preg_replace中包含“#”?
- 27. 如何在HTTP响应中包含Cookie(例如图片请求)?
- 28. 如何打印只包含一个子
- 29. 如何只包含@xml:lang属性?
- 30. 如何选择可能包含相同图案的图案?
查询不清楚。 – 2012-07-25 07:01:43