2015-06-16 52 views
0

我想要连接到数据库并将数据从oracle导入到文件或HIVE。 但是现在,我想使用oracle上的sqoop将查询中的数据导入到Hive中。data disapear import sqoop hive oracle

我以前使用的以下内容:我的文件夹布赫在 sqoop import --connect 'jdbc:oracle:thin:@server1:1521:ICIS' -P -- username JAPHONIE --query 'SELECT * FROM CONTRACTS INNER JOIN CONTRACT_VERSIONS ON CV_CON_NUMBER = CON_NUMBER WHERE $CONDITIONS' --target-dir BOUH --split-by CON_NUMBER --where '1=1'

这一个创建我的数据,所以在这一点上没有任何问题。

但是,当我使用以下命令: sqoop import --connect 'jdbc:oracle:thin:@server1:1521:ICIS' -P --username JAPHONIE --query 'SELECT * FROM CONTRACTS INNER JOIN CONTRACT_VERSIONS ON CV_CON_NUMBER = CON_NUMBER WHERE $CONDITIONS' --target-dir BOUH --split-by CON_NUMBER --where '1=1' --hive-import --hive-table BOUH

我布赫文件夹仅包含_SUCCESS,没有数据,并创建在HIVE表而空...... 我不明白的地方所行的问题从何而来。我没有任何错误信息要么...

你有什么想法吗?

编辑:我设法加载我的表,首先,执行第二个查询,它创建没有数据的表,然后删除空的文件夹并执行正确提取数据的第一个查询...但我想在一个查询中做同样的事情...

回答

0

您导入的数据将保存在/ user/hive/warehouse下,因为它是内部配置单元表,它不会保存在BOUH文件夹中在--target-dir中提到。你的脚本是正确的,你应该能够看到蜂巢表中的数据,因为你说你无法看到数据,请查看/ user/hive/warehouse文件夹一次。如果您无法看到数据,请在这里粘贴sqoop日志。

+0

这对我的环境有显着的不同...我现在使用hortonworks沙箱虚拟机。我用不同的查询使用相同的设置,它工作得很好,我有我的配置单元表和我的'bouh'文件夹下的数据...但与此查询,它不工作。 – Steven