2017-09-27 42 views
0

想知道是否可以跳过Aws Athena的org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe中的标题行。我尝试过tblproperties ('skip.header.line.count' = '1'),但不起作用。我的头文件与OpenCSVSerDe协同工作,但它似乎只支持string数据类型,这将在查询中结束很多工作。Athena:用LazySimpleSerde跳过标题行

回答

0

我刚才试过如下:

创建一个CSV文件并上传到S3:

breed_id, breen_name, category 
1,pug,toy 
2,German Shepard,working, 
3,Scottish Terrier,Working 

运行雅典娜以下DDL:

create external table dogs (
    breed_id int, 
    breen_name string, 
    category string 
) 
ROW FORMAT DELIMITED 
FIELDS TERMINATED BY ',' 
LINES TERMINATED BY '\n' 
LOCATION 's3://XXXXXXXXXXXXXX/' 
TBLPROPERTIES ('skip.header.line.count'='1') 
; 

然后运行下面的查询:

SELECT * FROM "default"."dogs" LIMIT 10; 

产生以下结果:

enter image description here