2015-04-21 46 views
-1

Aster Data中的所有组件似乎都有一个类似的Hadoop堆栈组件。Aster Data和Hadoop/Hive之间的区别

AFS => HDFS

SQL-MR =>蜂房

AMC => Ambari

ACT =>直线/蜂巢终端

Postgres的用于存储元数据=>配置单元可以是配置为在任何RDBMS中存储元数据

Queen/Worker => NameNode/Datanode

SQL-GR => Giraph

除了提供预构建函数包之外,还有什么是显着不同的,并且在Hadoop中不可用?

回答

2

你的问题并不坏,这是错误的。可能来自Hadoop一方,您提出的问题是使用Hadoop架构,它是分层和/或集成有点独立的组件,每个都有其自己的功能规格,配置和执行环境等。Hadoop架构

为什么这是错误的?因为如果比较Hadoop和Oracle或SAP数据库,你不会问同样的问题,对吧?

是的,Aster的每个对应方都与Hadoop堆栈产品相匹配 - 与Aster不同的是没有这样的堆栈(至少从6.x开始)。 Aster是与Hadoop堆栈功能相匹配但不包含组件的数据库和分析引擎。

例如,ACT是一种类似于SQL * Plus的命令行实用程序,用于在客户端/服务器接口上运行的Oracle。它与Hadoop之上的Hive基础设施完全不同。 Aster文件系统是集成到Aster软件中的复杂可插入功能层 - 不是作为HDFS和Hadoop的独立框架和软件。

Aster分析引擎最显着的区别是由SQL,SQL/MR和SQL/GR组成。这意味着在数据存储上运行的数据存储和操作符(SQL语句,SQL/MR或SQL/GR函数)之间没有功能上或操作上的差距 - 它们生活在相同的环境中(配置,执行,维护,支持)。例如,列表和基于行的表对于在它们上执行的任何操作是完全透明的(禁止先前和设计定义的约束)。

因此,您的类比确实解释了Hadoop方程式的一面,而没有真正给出适当的归因于Aster。

0

我认为你不必要地讨厌。问题是在概念上。说Netezza和Teradata MPP。在基本概念中,他们是相同的,他们做同样的工作,但他们是两个不同的物理实现与他们自己的算法,存储,索引等。

在一个非常高的水平Hive和Aster有相似之处,因为他们都运行映射减少分布式存储。

唯一的区别是,在非常高的水平上,Aster可以运行典型的RDMS查询以及隐式地图缩小,其中Hive只是地图缩小。

+0

这是问题所在。不知何故,有人只是在Hadoop工作。很少有新概念的东西。传统的MPP RDBMS家伙们等待着,尽可能多地等待牛奶,因为他们的核心工程师已经在其DB数据引擎中实现了至少20年。新的祖先只是实施了扩展的核心后台流程,但具有各种局限性。唯一的USP是他们花费较少的理由。实际上,取代PIG,使用任何ETL或Talend进行摄取,转换和清理,并支持流式传输都是有意义的。 – user3423890

相关问题