需要在amazon EMR bootstrap动作上安装一些软件包和二进制文件,但我找不到任何使用它的示例。如何在代码中的amazon EMR bootstrap动作上安装自定义包?
基本上,我想安装python包,并指定每个hadoop节点使用此包来处理s3桶中的项目,这里是一个示例frpm boto。
name='Image to grayscale using SimpleCV python package',
mapper='s3n://elasticmapreduce/samples/imageGrayScale.py',
reducer='aggregate',
input='s3n://elasticmapreduce/samples/input',
output='s3n://<my output bucket>/output'
我需要使它使用SimpleCV python包,但不知道在哪里指定此。如果没有安装,如何安装?有没有办法避免等待安装完成,是否有可能将其安装在某处并引用python包?
听说过“boto”吗? – emeth
是的,这就是我从 – KJW