0
是否可以在Google Cloud Dataproc上编译和构建自定义Apache Spark?可以说我们想调整Apace Spark,然后想在dataproc上构建自定义的Spark。在Dataproc上运行自定义的spark构建?
是否可以在Google Cloud Dataproc上编译和构建自定义Apache Spark?可以说我们想调整Apace Spark,然后想在dataproc上构建自定义的Spark。在Dataproc上运行自定义的spark构建?
这应该是可以的。 Dataproc为您提供正常的计算引擎虚拟机,并设置Hadoop和YARN。
您可以登录到任何机器,安装您自定义的火花编译并指定YARN和Hadoop安装(Dataproc)。但是,我怀疑你能够使用GCP控制台或dataproc命令行界面来提交和监视作业,而无需进一步修改。
您可能想要使用init操作来确保所有节点都使用您的火花版本,而不是尝试加载预安装的火花。初始化操作基本上是在所有节点上运行的任意脚本。 https://cloud.google.com/dataproc/docs/concepts/configuring-clusters/init-actions –