我可以成功如何使用Sqoop从MySQL到Hive的增量导入?
sqoop job -create JOBNAME ... --incremental append --check-column id --last-value LAST
sqoop job -exec JOBNAME
与像
INFO tool.ImportTool: Saving incremental import state to the metastore
INFO tool.ImportTool: Updated data for job: JOBNAME
日志消息结束和检查工作表明,incremental.last.value被正确的更新做从MySQL到HDFS使用Sqoop增量进口。
如果我尝试相同的过程,但将“--hive-import”添加到我的作业的定义中,它将成功执行,但不会更新incremental.last.value。
这是一个错误?意图行为?有没有人有从MySQL增量导入数据并通过Hive使其可用的过程?
我基本上希望我的Hadoop集群成为我的MySQL数据库的读取从属设备,以便进行快速分析。如果除Hive之外还有其他解决方案(猪会很好),我也很乐意听到。
我只是在了解配置单元的过程中,还没有实际设置它。 我真的对这个问题的答案真的很感兴趣。 –