我在Amazon EC2实例中有一个linux实例。我在这个实例中手动安装了Spark并且工作正常。接下来,我想在亚马逊建立一个火花集群。 我在EC2上的文件夹运行以下命令:spark-submit亚马逊EC2
spark-ec2 -k mykey -i mykey.pem -s 1 -t t2.micro launch mycluster
它成功地推出了主机和一个工作节点。我可以ssh进入主节点使用ssh -i mykey.pem ec2-user @ master
我还导出了密钥:AWS_ACCESS_KEY_ID和AWS_SECRET_ACCESS_KEY。
我有一个jar文件(其中有一个简单的星火计划),我试图向到主:
spark-submit --master spark://<master-ip>:7077 --deploy-mode cluster --class com.mycompany.SimpleApp ./spark.jar
,但我得到了以下错误:
Error connecting to master (akka.tcp://[email protected]<master>:7077).
Cause was: akka.remote.InvalidAssociation: Invalid address: akka.tcp://[email protected]<master>:7077
No master is available, exiting.
我m也更新了主设备接受所有入站流量的EC2安全设置: 类型:所有流量,协议:全部,端口范围:全部,来源:0.0.0.0/0
微观实例对于火花来说可能太小。我倾向于选择c3/c4实例,如果需要大量CPU来完成某项任务,像c3.8xlarge这样的较大型CPU可以减少对网络的需求,并且可以使用“现货定价”在一两个小时内实现负担得起低于零售价。 – Paul