我通过mrjob/boto模块将代码发送到亚马逊的EMR。我有一些外部python依赖项(即numpy,boto等),目前必须下载python包的源代码,并将它们作为tar包发送到mrjob.config文件的“python_archives”字段中。EMR上的Python依赖关系管理
这使得依赖管理比我想要的更混乱,并且想知道我是否可以以某种方式使用与我的virtualenv安装程序相同的requirements.txt文件来引导emr实例和我的依赖项。是否有可能建立在EMR实例的virtualenv的和做的是这样的:
pip install -r requirements.txt
,我会在本地?