2017-02-08 29 views

回答

1

这应该是可以的。 Dataproc为您提供正常的计算引擎虚拟机,并设置Hadoop和YARN。

您可以登录到任何机器,安装您自定义的火花编译并指定YARN和Hadoop安装(Dataproc)。但是,我怀疑你能够使用GCP控制台或dataproc命令行界面来提交和监视作业,而无需进一步修改。

+0

您可能想要使用init操作来确保所有节点都使用您的火花版本,而不是尝试加载预安装的火花。初始化操作基本上是在所有节点上运行的任意脚本。 https://cloud.google.com/dataproc/docs/concepts/configuring-clusters/init-actions –

相关问题