2016-11-25 62 views
1

我有一个问题围绕存储大小计算/估计的表加载到HAWQ?HAWQ表大小估计

我在HIVE一个30MB表,我试图使用PXF成HAWQ,例如加载: 创建表t2表空间的数据作为SELECT * FROM hcatalog.default.afs_trvn_mktscn_population;

HAWQ中的表占用369MB的存储空间?无论我拥有多少个HAWQ细分以及HAWQ DFS.replica因子或HDFS复制因子是什么?我的情况下,即使有4个HAWQ段或1个HAWQ段,加载后的表大小为369MB。

我可以理解,最小块大小是128MB,所以即使30MB将使用128MB的最小值,但为什么> 300MB?

你能分享一些这方面的信息吗?

回答

1

您的Hive表格可能存储为具有Snappy压缩的ORC,而您的HAWQ表格甚至未被压缩。你应该在你的HAWQ表中使用这个:

with (appendonly=true, orientation=parquet, compresstype=snappy)