你的问题并不坏,这是错误的。可能来自Hadoop一方,您提出的问题是使用Hadoop架构,它是分层和/或集成有点独立的组件,每个都有其自己的功能规格,配置和执行环境等。Hadoop架构
为什么这是错误的?因为如果比较Hadoop和Oracle或SAP数据库,你不会问同样的问题,对吧?
是的,Aster的每个对应方都与Hadoop堆栈产品相匹配 - 与Aster不同的是没有这样的堆栈(至少从6.x开始)。 Aster是与Hadoop堆栈功能相匹配但不包含组件的数据库和分析引擎。
例如,ACT是一种类似于SQL * Plus的命令行实用程序,用于在客户端/服务器接口上运行的Oracle。它与Hadoop之上的Hive基础设施完全不同。 Aster文件系统是集成到Aster软件中的复杂可插入功能层 - 不是作为HDFS和Hadoop的独立框架和软件。
Aster分析引擎最显着的区别是由SQL,SQL/MR和SQL/GR组成。这意味着在数据存储上运行的数据存储和操作符(SQL语句,SQL/MR或SQL/GR函数)之间没有功能上或操作上的差距 - 它们生活在相同的环境中(配置,执行,维护,支持)。例如,列表和基于行的表对于在它们上执行的任何操作是完全透明的(禁止先前和设计定义的约束)。
因此,您的类比确实解释了Hadoop方程式的一面,而没有真正给出适当的归因于Aster。
这是问题所在。不知何故,有人只是在Hadoop工作。很少有新概念的东西。传统的MPP RDBMS家伙们等待着,尽可能多地等待牛奶,因为他们的核心工程师已经在其DB数据引擎中实现了至少20年。新的祖先只是实施了扩展的核心后台流程,但具有各种局限性。唯一的USP是他们花费较少的理由。实际上,取代PIG,使用任何ETL或Talend进行摄取,转换和清理,并支持流式传输都是有意义的。 – user3423890