据http://sqoop.apache.org/docs/1.4.0-incubating/SqoopUserGuide.html#id1764646我可以使用Sqoop将数据导入RCFile格式吗?
可以导入两种文件格式之一的数据:分隔文本或 SequenceFiles。
但是RCFile呢?
是否可以使用Sqoop将数据从Oracle DB导入到HDFS格式的RCFile中?
如果是,该怎么办?
据http://sqoop.apache.org/docs/1.4.0-incubating/SqoopUserGuide.html#id1764646我可以使用Sqoop将数据导入RCFile格式吗?
可以导入两种文件格式之一的数据:分隔文本或 SequenceFiles。
但是RCFile呢?
是否可以使用Sqoop将数据从Oracle DB导入到HDFS格式的RCFile中?
如果是,该怎么办?
Sqoop目前不支持RC文件。有一个jira SQOOP-640添加此功能。
Step 1: Create a ORC formatted table (base) in Hive.
CREATE TABLE IF NOT EXISTS tablename (hivecolumns) STORED AS RCFILE
Step 2 : Sqoop import to this RC table using HCatalog tool.
SQOOP IMPORT
--connect sourcedburl
--username XXXX
--password XXXX
--table source_table
--hcatalog-database hivedb
--hcatalog-table tablename
[HCatalog的表抽象呈现在Hadoop分布式文件系统(HDFS)数据的关系视图的用户,并确保用户不必担心在何处或以何种格式的数据存储 - RCFile格式,文本文件,SequenceFiles或ORC文件。]
很酷,谢谢澄清。 – Bohdan 2013-02-22 03:44:43