2013-12-08 83 views

回答

1

我知道配置单元将数据保存为hadoop文件系统中的分区。

Hive不存储数据。 Hive可以被认为是MapReduce计算模型之上的更高层次的抽象。

假设数据已经存在于HDFS中并且该表是在Hive中创建的,则LOAD DATA命令将只将HDFS中的数据映射到Hive中创建的表。该映射存储在默认情况下为derby的Hive Metastore数据库中。 Here是一篇关于Hive Metastore类型以及如何配置它们的文章。

这是一个在Metastore数据库中插入/更新几行的问题,这就是为什么LOAD DATA命令速度很快的原因。