2017-05-10 121 views

回答

3

让我们bash

hdfs dfs -cat /file/on/hdfs | head -15 > tmp ; file -i tmp ; rm tmp 

对于喜欢不可读文件parquet等你会得到这样的:

tmp: application/octet-stream; charset=binary 
+0

@devツ'TMP:文本平原; charset = ascii'我刚刚得到这个TXT文件。不是那么重要,而是你在哪个版本上? – philantrovert

+0

其工作正常,具有文本数据,或制表符作为分隔符。但是我的文本数据由** CTRL^A **(_default hive delimiter_)分隔。它返回'tmp:application/octet-stream;字符集=二进制“在这种情况下。 –

+0

从技术上讲,这是一个不可打印的字符。 – philantrovert

相关问题