2017-07-18 42 views
1

我正在学习Amazon Redshift。听说它是云上非常强大的存储,并且在需要聚合操作的数据上工作得非常快,因为它按列存储数据。Amazon Redshift中的列式数据库查询

我无法找到任何示例查询?有人可以与我分享在Amazon Redshift上运行的汇总查询的一些示例吗?它与正常的关系数据库查询有什么不同?

回答

4

你是对的 - Amazon Redshift是一个柱状数据库。这意味着数据存储在磁盘每列,使得在列上的操作非常快。例如,在Country列中为特定值添加Sales列仅需要访问两列而不是表中的所有列。

其它好处是,在红移数据是压缩(与柱状概念运作良好,因为每列使用基于存储的数据自身的压缩方法),事实上,它是一个集群数据库,因此可以通过添加额外的节点来缩放计算和存储。

亚马逊红移提出了自己作为一个PostgreSQL数据库,所以你只需使用行业标准的SQL查询数据。不需要更改查询。

但是,您可以通过明智地选择为每个决定数据分布在节点表分发密钥优化红移,并仔细选择排序键,这就决定了数据如何存储在每个节点上。简而言之,数据应按照JOIN表分配,并按照WHERE语句中的用法排序。

至于样品查询 ......它完全取决于您的数据!查询看起来与正常SQL完全一样。

相关问题