2017-04-05 39 views
2

所以我想运行我mrjob但得到的第一行错误:无法导入电子病历mrjob

ImportError: No module named mrjob.job 

我发动工作,如下所示:

python main.py --bootstrap-mrjob -v -r emr --emr-job-flow-id j-XXXXXXXXX ../data/data.txt 

我也尝试在我的mrjobs.conf中添加以下行:

bootstrap: 
- sudo pip install mrjob 

它不起作用。 那么如何解决它?

编辑: 其实我没有得到这个错误,如果我从命令行创建集群,但如果我想在已经运行的集群上运行脚本,它会失败,并出现此错误。

编辑: 所以一个更不同的是,从命令行创建的集群,我有以下的步骤

PENDING (cluster is BOOTSTRAPPING: Running bootstrap actions) 

但已经运行的群我没有它

回答

0

你需要明确地传递mrjobs.conf:-c mrjobs.conf

+0

我做了,它没有帮助 – mirt

+0

我看到了您的编辑,如果集群已经在运行,那么您不必引导mrjob,因为它已经在启动时自引导个CLU ter被创建。 – Bill