2014-05-23 35 views
0

我目前在探索Tera数据Aster(Aster express 6)。我已经通过文档和博客,但没有解释如何查询作品。 ,因为它是如何分配他们的SQL和SQL-MR取数据,他们是否在内部生成地图缩减作业?SQL和SQL-MR查询如何在Teradata内部工作?

例如客户表有10条记录,这些记录是散列(客户id)分布的,并且说他们是3名工人(除了asterdata中的节点外),数据在两个节点上分为3条记录,节点。

在SQL 客户简单的SELECT *;将在这种情况下工作?

但在ASTER数据这个查询工作。

它是如何获取从3个节点记录?如果普通的sql查询可以记录记录,那么为什么我们需要MapReduce,我们可以使用多重子查询来完成任务?

如果数据分布在多台机器上,那么mapreduce是处理数据的唯一方法?

这将真正帮助我,如果有人解释说这个!

Pradi

+1

并行和分布式数据库的主题看起来对于堆栈溢出问题来说太广泛了。 –

回答

1

www.teradata.com/white-paper/Using-SQL-MapReduce-for-Advanced-Analytical-Queries/是Teradata的赞助的白皮书,阐述其基本原理结合MapReduce的SQL一起,并且应该是提高理解的良好开端。