2
所以我想运行我mrjob但得到的第一行错误:无法导入电子病历mrjob
ImportError: No module named mrjob.job
我发动工作,如下所示:
python main.py --bootstrap-mrjob -v -r emr --emr-job-flow-id j-XXXXXXXXX ../data/data.txt
我也尝试在我的mrjobs.conf中添加以下行:
bootstrap:
- sudo pip install mrjob
它不起作用。 那么如何解决它?
编辑: 其实我没有得到这个错误,如果我从命令行创建集群,但如果我想在已经运行的集群上运行脚本,它会失败,并出现此错误。
编辑: 所以一个更不同的是,从命令行创建的集群,我有以下的步骤
PENDING (cluster is BOOTSTRAPPING: Running bootstrap actions)
但已经运行的群我没有它
我做了,它没有帮助 – mirt
我看到了您的编辑,如果集群已经在运行,那么您不必引导mrjob,因为它已经在启动时自引导个CLU ter被创建。 – Bill