2015-09-09 38 views
1

我知道Hadoop是基于主/从结构差异典型的Hadoop架构和MAPR建筑之间

HDFS作品与NameNodesDataNodes

MapReduce作品与jobtrackersTasktrackers

但我做不到在MapR找不到所有这些服务,我发现它有自己的服务架构

我有点困惑,有没有人可以告诉我只使用Hadoop和使用MapR的区别?

回答

3

MapR和Apache Hadoop在存储级别不具有相同的体系结构。MapR使用自己的文件系统MaRFS,它在概念和实现方面与HDFS完全不同。你可以在这里找到更详细的比较:https://www.mapr.com/blog/comparing-mapr-fs-and-hdfs-nfs-and-snapshots#.VfGwwxG6eUk https://www.mapr.com/resources/videos/comparison-mapr-fs-and-hdfs

+0

Mapr使用80%的Apache分布作为基准。在这里看到图表。 http://www.networkworld.com/article/2369327/software/comparing-the-top-hadoop-distributions.html – gyan

+1

MapR确实支持来自Apache的计算工具,但它与存储(文件系统)的观点完全不同和集群服务(这个问题的上下文) – pradeep

6

您必须参考Hadoop 2.x最新的架构自YARN(另一资源谈判器)& High Availability已在2.x版本中引入。

工作跟踪和任务跟踪器被替换为资源管理器,节点管理器和应用程序管理器

Hadoop 2.x YARN & High Availability

对于MapR架构,请参阅MapR文章

对于不同的分销商之间的比较,参考该图像

enter image description here

详细比较可在Data-magnum文章Bill Vorhies

1

Mapr使用大部分Apache bigdata分布作为基准。 enter image description here Mapr是一个hadoop(和bigdata技术堆栈)分发提供程序,为其客户端提供了一些附加组件和技术支持。

下划线mapr与apache hadoop完全在同一架构上,包括所有核心库发行版。然而,mapr分布更像是一套完整的兼容bigdata技术包。

mapr的主要好处是,它的各种技术,如配置单元,hbase,火花等的分布将与核心hadoop和彼此之间兼容。这一点我特别重要,因为bigdata技术正在以不同的速度发展,因此新闻稿很快就会变得不兼容。

因此,诸如mapr,cloudera等供应商正在提供他们的hadoop归属和支持版本,以便最终用户可以专注于产品构建而不必担心兼容性问题。但几乎所有人都在地毯下使用apache发行版。

未来,他们可能会出现某些变化和其他功能,以阻止客户切换到其他供应商,但截至目前情况并非如此。

+0

MapR和Apache Hadoop在存储级别没有相同的体系结构。 MapR使用自己的文件系统MaRFS,它在概念和实现方面与HDFS完全不同。 你可以在这里找到更详细的比较:https://www.mapr.com/resources/videos/comparison-mapr-fs-and-hdfs https://www.mapr.com/blog/comparing-mapr- fs-and-hdfs-nfs-and-snapshots#.VfGrUBG6eUk – pradeep

+0

@Pradeep,我说Mapr和Apache的发行版完全一样吗?您能确认Mapr拥有其所有Bigdata平台的专有版本,并且没有将Apache分发作为基准吗? – gyan

+0

我说他们在存储层面不一样。在MapRFS和HDFS中存储数据的概念是完全不同的。上图比较了计算工具(不是存储部分)。 MapR支持主要来自Apache的所有计算工具(如MR,配置单元,猪等)。 问的问题是在HDFS体系结构中。 – pradeep