2013-10-06 96 views
0

我不清楚分区和分区之间的区别,如果你可以提供一些例子的细节,真的很感激。配置单元中的分区和分区有什么区别?

+1

看看这个问题http://stackoverflow.com/questions/19128940/what-is-the-difference-between-partitioning-and-bucketing-a-table-in-hive/19131221#19131221 –

回答

7

Here桶和分区之间是一个很好的区别。

基本上,分区和Bucketing基本上比执行查询的数据更有效地比非切片数据。主要区别在于,在数据被修改的情况下,在分区的情况下片的数量将保持变化,但是具有分区的片的数量是固定的,其在创建表时被指定。

Bucketing通过使用哈希算法,然后模块桶的数量发生。所以,一行可能会插入到任何存储桶中。 Bucketing可用于数据采样,也可用于更有效地连接两个数据集。

相关问题