我在Sqoop中有以下问题吗?Sqoop投机执行
- 我很好奇,如果我们可以设置一个sqoop导入/导出作业的推测执行。
- 我们是否也有任何选择在sqoop导入/导出过程中设置减速器数量的选项。根据我的分析,sqoop不需要任何reducer,但不知道我是否正确。请在此纠正我。
- 我用sqoop和mysql,oracle以及其他数据库可以使用除上面以外的其他数据库。
感谢
我在Sqoop中有以下问题吗?Sqoop投机执行
感谢
1)在默认情况下,推测执行sqoop是关闭的,因为如果有多个映射器运行单任务,我们就得到了HDFS数据的副本。因此为了避免这种降低,它已经关闭了。
2)sqoop作业的还原器数量为0,因为它仅仅是一个作业,它运行将数据转储到HDFS的仅MAP作业。我们不汇总任何内容。
3)您可以使用Postgresql,HSQLDB以及mysql,oracle。 mysql和Postgre支持直接导入。
推测性执行默认情况下处于打开状态。它可以独立启用或禁用 地图任务和减少任务,在集群范围内或基于每个作业。
[NO减速器为Sqoop] [1]:http://i.stack.imgur.com/CH8pb.png
任何JDBC兼容RDBMS即MySQL和甲骨文,Postgre