我已经创建了jar,它运行mapReduce并在某个目录下生成输出。 我需要从我的java代码中的输出目录中读取输出数据中的数据,这些数据不是在hadooop环境中运行的,也不需要将其复制到本地目录中。 我正在使用ProcessBuilder来运行Jar.can任何一个帮助我.. ??如何从hadoop获取输出数据?
1
A
回答
1
您可以编写以下代码来读取MR驱动程序代码中作业的输出。
job.waitForCompletion(true);
FileSystem fs = FileSystem.get(conf);
Path[] outputFiles = FileUtil.stat2Paths(fs.listStatus(output,new OutputFilesFilter()));
for (Path file : outputFiles) {
InputStream is = fs.open(file);
BufferedReader reader = new BufferedReader(new InputStreamReader(is));
---
---
}
1
使用HDFS API读取HDFS数据时出现什么问题?
public static void main(String[] args) throws IOException {
// TODO Auto-generated method stub
Configuration conf = new Configuration();
conf.addResource(new Path("/hadoop/projects/hadoop-1.0.4/conf/core-site.xml"));
conf.addResource(new Path("/hadoop/projects/hadoop-1.0.4/conf/hdfs-site.xml"));
FileSystem fs = FileSystem.get(conf);
FSDataInputStream inputStream = fs.open(new Path("/mapout/input.txt"));
System.out.println(inputStream.readLine());
}
您的程序可能已经用完了您的hadoop集群,但hadoop守护程序必须正在运行。
相关问题
- 1. Hadoop 0.2:如何从TextOutputFormat读取输出?
- 2. 如何从流式Hadoop作业获取压缩(文本)输出
- 3. Hadoop如何获取未存储在HDFS上的输入数据?
- 4. 如何从Python Beaglebone使用Python获取数据输出
- 5. 如何从数据库表中获取xml输出
- 6. 如何从directshow滤波器输出引脚获取数据?
- 7. hadoop mongodb连接器读取数据,但输出为mysql数据
- 8. 如何从hadoop的临时文件中获取数据?
- 9. 尝试从Hdfs输出读取hadoop
- 10. 如何将数据从Hadoop导出到MySQL /任何数据库?
- 11. 如何从CreateProcessWithLogonW获取标准输出?
- 12. 如何从usemin任务获取输出?
- 13. 如何从R脚本获取输出
- 14. 如何从eval()获取console.log输出?
- 15. execv如何从管道获取输出?
- 16. 如何从NBoilerPipe获取HTML输出?
- 17. 如何从Rails Runner获取输出?
- 18. 如何从mysql插入获取输出?
- 19. 如何从javascript/jQuery获取html输出?
- 20. 如何从DataGrid获取HTML输出?
- 21. 如何从oprofile输出获取callstack?
- 22. 如何从json数据的输出中获取特定的数据?
- 23. 如何从php://输入数据获取数据?
- 24. 为Hadoop/PIG输出数据分配ID
- 25. 如何从powershell函数获取输出到例如txt的输出文件中?
- 26. 如何从java 8中的js函数获取数组输出?
- 27. 如何在Hadoop中获取计数器
- 28. 获取从输出参数C#
- 29. 从数字开始获取rownums输出
- 30. 获取从JavaScript函数输出在C++