2015-04-22 35 views
1

我在Sqoop中有以下问题吗?Sqoop投机执行

  • 我很好奇,如果我们可以设置一个sqoop导入/导出作业的推测执行。
  • 我们是否也有任何选择在sqoop导入/导出过程中设置减速器数量的选项。根据我的分析,sqoop不需要任何reducer,但不知道我是否正确。请在此纠正我。
  • 我用sqoop和mysql,oracle以及其他数据库可以使用除上面以外的其他数据库。

感谢

回答

3

1)在默认情况下,推测执行sqoop是关闭的,因为如果有多个映射器运行单任务,我们就得到了HDFS数据的副本。因此为了避免这种降低,它已经关闭了。

2)sqoop作业的还原器数量为0,因为它仅仅是一个作业,它运行将数据转储到HDFS的仅MAP作业。我们不汇总任何内容。

3)您可以使用Postgresql,HSQLDB以及mysql,oracle。 mysql和Postgre支持直接导入。

0
  1. 推测性执行默认情况下处于打开状态。它可以独立启用或禁用 地图任务和减少任务,在集群范围内或基于每个作业。

  2. [NO减速器为Sqoop] [1]:http://i.stack.imgur.com/CH8pb.png

  3. 任何JDBC兼容RDBMS即MySQL和甲骨文,Postgre