2011-10-24 148 views
0

因为bz2是可拆分的并节省空间,所以我计划以bzip2格式存储表格数据。 但是,它似乎没有识别压缩格式。 gzip格式很好。 我使用的代码看起来是这样的:如何让Hive与bz2一起工作?

CREATE TABLE IF NOT EXISTS image_bzip (
    image_id STRING, 
    image_feature STRING, 
    other_stuff STRING) 
ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE LOCATION '/hivestore/bzip'; 

LOAD DATA LOCAL INPATH '/nfs/directory/*.bz2' OVERWRITE INTO TABLE image_bzip; 

有人能指出我我缺少的是什么?

谢谢。

回答

1

如果我们正确设置了压缩编解码器,它自然地工作。

1

为什么不尝试用HDFS上的bz2压缩文件创建外部表?