我已经定义了一个蜂巢表,其中一列包含JSON文本:Presto/Athena - 查询发现JSON属性频率?
CREATE EXTERNAL TABLE IF NOT EXISTS my.rawdata (
json string
)
PARTITIONED BY (dt string)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
WITH SERDEPROPERTIES (
'separatorChar' = '\n',
'quoteChar' = '\0',
'escapeChar' = '\r'
)
STORED AS TEXTFILE
LOCATION 's3://mydata/';
是否有普雷斯托/雅典娜查询可以列出了JSON内发生的所有字段名和它们的频率(即总数该属性出现在表中)?
P.S.的钥匙表格定义是一团糟。 OpenCSVSerde? quoteChar? escapeChar? –