2015-12-21 57 views
0

我不清楚在Redshift中使用COPY命令时自动压缩如何工作。红移COPY自动压缩

文档说:

默认情况下,只要您运行COPY命令用空目标表和所有表列要么有RAW编码或不编码的COPY命令将应用于自动压缩。

这是否意味着对于其中的原始数据是在现有基础上复制我的主表,数据将被压缩后只有第一次复制会出现此表也再没有后续的时间?似乎我误解了一些原因,这是没有道理的,它会这样工作。

THX

回答

3

基本上是一个编码(压缩)类型需要创建表时要对每列设置。但是,从AWS文档中引用的例外情况来看,当数据复制到空表中时,Redshift会自动分析并设置 对所有列以及复制数据的最佳编码。然后,后续数据将使用设置的编码进行压缩。

因此,您的问题的答案是“否”。一旦编码(压缩)通过任一方式设置,后续项目将被压缩。

0

我确认了Masashi的回答。请注意:

自动压缩分析需要在加载数据中有足够的行(每个切片至少100,000行)才能进行采样。

如果您在小批量上运行COPY,您的表将被设置为无编码。所有随后的COPY电话都不会改变这一点。您稍后可以通过运行表格的深层副本来解决此问题。