2017-06-27 44 views
0

我的理解是运行Dataproc集群而不是设置自己的计算引擎集群是因为它负责安装存储连接器(和其他连接器)。它还为你做了什么?谷歌云上的dataproc集群

回答

3

Dataproc的超越DIY群最显著特点是,通过一个API,WebUI和CLI提交作业(Hadoop的&星火罐,蜂巢查询等),而无需配置棘手的网络防火墙和暴露纱世界的能力。

Cloud Dataproc还负责很多配置和初始化,例如为Hive和Spark设置共享的Hive Metastore。并允许在启动时指定Hadoop,Spark等属性。

它以大约90秒的时间启动集群,根据我的经验,它比大多数集群设置更快。这可以让你在不感兴趣的情况下拆除集群,而不必等待几十分钟才能启动新集群。

我鼓励你看看更全面的list of features