Q
HDFS文件比较
3
A
回答
11
提供了用Hadoop没有diff
命令,但你可以在你的shell与diff
命令实际使用重定向:
diff <(hadoop fs -cat /path/to/file) <(hadoop fs -cat /path/to/file2)
如果你只是想知道,如果两个文件是相同的或并非没有照顾到知道差异,我会建议另一种基于校验和的方法:你可以得到两个文件的校验和然后比较它们。我认为Hadoop不需要生成校验和,因为它们已经存储了,所以它应该很快,但我可能是错的。我不认为这有一个命令行选项,但你可以用Java API轻松做到这一点,并创建一个小应用程序:
FileSystem fs = FileSystem.get(conf);
chksum1 = fs.getFileChecksum(new Path("/path/to/file"));
chksum2 = fs.getFileChecksum(new Path("/path/to/file2"));
return chksum1 == chksum2;
3
好,最简单的答案很可能是:
diff <(hadoop fs -cat file1) <(hadoop fs -cat file2)
它只是将你的本地计算机上运行。如果这太慢了,那么是的,你必须对Hive和MapReduce做些什么,但这有点棘手,并且不会与diff的按序比较完全匹配。
相关问题
- 1. 2 Hdfs文件比较
- 2. hdfs中的两个文件比较
- 3. 如何将hdfs文件与unix文件进行比较?
- 4. 我们如何比较的一致性LOCALFILE和HDFS文件
- 5. 文件比较
- 6. 文件比较
- 7. 文件比较
- 8. 比较文件.class Bejond比较4
- 9. 文件夹/文件比较
- 10. 多文件比较
- 11. xml文件比较
- 12. Powershell比较文件
- 13. Unix文件比较
- 14. 比较文件名
- 15. Jmeter文件比较
- 16. xml文件比较
- 17. C文件比较
- 18. 比较xml文件
- 19. linux文件比较
- 20. 比较.properties文件
- 21. xml文件比较
- 22. perl文件比较
- 23. 比较WSDL文件
- 24. 比较csv文件
- 25. Powershell文件比较
- 26. XML文件比较
- 27. SSIS比较文本文件
- 28. 文本文件比较
- 29. 比较XML文件和文本文件
- 30. DUnit比较两个文本文件并显示比较
你使用的是什么版本的hadoop?你在使用CDH发行版吗? –