0
如何在不使用distcp
命令的情况下将配置单元数据从一个Hadoop群集移动到另一个Hadoop群集。因为我们不能使用这个。我们有另一种选择,如Sqoop或Flume吗?将hive数据从一个Hadoop集群移到另一个集群而不使用distcp命令?
如何在不使用distcp
命令的情况下将配置单元数据从一个Hadoop群集移动到另一个Hadoop群集。因为我们不能使用这个。我们有另一种选择,如Sqoop或Flume吗?将hive数据从一个Hadoop集群移到另一个集群而不使用distcp命令?
distcp是将大量数据从一个hadoop群集移到另一个群集的有效方法。
Sqoop和Flume不能用于将数据从一个hadoop群集传输到另一个群集。 Sqoop主要用于在hadoop和关系数据库之间移动数据,而Flume则用于将流数据提取到Hadoop。
你的另一种选择是使用:像卡夫卡
hadoop fs
像cp
或get
shell命令之后put
仅供参考,当你在谈论蜂房数据,你也应该考虑保持在同步集群之间蜂巢元数据(metastore)。
感谢您的回复和建议Ashrith, 我在想,我可以这样做: sqoop进口--connect的jdbc:hive2://am1dlccmrhdn04.r1-core.r1.aig.net:10000/test_vk --driver org.apache.hive.jdbc.HiveDriver --username codspug --table sqooptest -m 1 --hive-import --target-dir/tmp/TESTVK/ 从开始起,它给出错误,如方法不支持的。 我们可以用Map Reduce program.or或其他任何方式来实现它吗? 请帮助,因为你建议我们可以使用卡夫卡,但在这里不能使用卡夫卡。 请帮我一下吗? –