直接通过数据文件查看配置单元的内容

因此，问题在于，对于真正大型的表格，配置单元需要花费大量的时间才能显示表格的一些行。因此，例如，直接通过数据文件查看配置单元的内容

select * from table limit 1000;

对于十亿记录表可能需要20分钟。我认为只需查看表格的数据文件配置单元存储可能会快很多。我可以这样做 -

hadoop fs -cat hdfs://ipAddr/mnt/hive/<path to one of the table files> | head

问题是，行显示为一个大的行，没有明显的分隔符。因此很难说明一列何时结束而另一列开始。现在，这些文件中必须有一个分隔符来区分列，只是由于某种原因，猫无法看到它。有没有办法用某种可见的分隔符来查看数据行？

默认情况下，蜂巢使用CTRL-A作为分隔符（字符1），所以我建议你用标签，或逗号，或任何替换它：

hadoop fs -cat hdfs://ipAddr/mnt/hive/<path> | tr '\001' '\t' | head

2013-11-25 04:15:53

回答