我在BigQuery documentation中读到它支持表达式语言的一个子集JsonPath。但是我找不到实际上支持的JsonPath的哪个部分是?例如,当我在控制台中试用时,我似乎无法在BigQuery的JsonPath表达式中使用通配符或过滤器。BigQuery支持哪些JsonPath表达式?
- 是否可以在BigQuery中的JsonPath表达式中使用通配符和过滤器?
- 是否有参考文档或其他文档描述完整在BigQuery中的JsonPath支持(因为我似乎无法找到它)?
我在BigQuery documentation中读到它支持表达式语言的一个子集JsonPath。但是我找不到实际上支持的JsonPath的哪个部分是?例如,当我在控制台中试用时,我似乎无法在BigQuery的JsonPath表达式中使用通配符或过滤器。BigQuery支持哪些JsonPath表达式?
是否有可能在BigQuery中的JsonPath表达式中使用通配符和过滤器?
为了克服BigQiery“限制”为JsonPath,一个可以引入custom function为例如下所示:
注:它使用jsonpath-0.8.0.js可以从https://code.google.com/archive/p/jsonpath/downloads下载并上传到谷歌云存储 - GS://your_bucket/jsonpath-0.8.0.js
#standardSQL
CREATE TEMPORARY FUNCTION CUSTOM_JSON_EXTRACT(json STRING, json_path STRING)
RETURNS STRING
LANGUAGE js AS """
try { var parsed = JSON.parse(json);
return JSON.stringify(jsonPath(parsed, json_path));
} catch (e) { return null }
"""
OPTIONS (
library="gs://your_bucket/jsonpath-0.8.0.js"
);
WITH t AS (
SELECT '''
{ "store": {
"book": [
{ "category": "reference",
"author": "Nigel Rees",
"title": "Sayings of the Century",
"price": 8.95
},
{ "category": "fiction",
"author": "Evelyn Waugh",
"title": "Sword of Honour",
"price": 12.99
},
{ "category": "fiction",
"author": "Herman Melville",
"title": "Moby Dick",
"isbn": "0-553-21311-3",
"price": 8.99
},
{ "category": "fiction",
"author": "J. R. R. Tolkien",
"title": "The Lord of the Rings",
"isbn": "0-395-19395-8",
"price": 22.99
}
],
"bicycle": {
"color": "red",
"price": 19.95
}
}
}
''' AS x
)
SELECT
CUSTOM_JSON_EXTRACT(x, '$.store.book[*].author'),
CUSTOM_JSON_EXTRACT(x, '$..*[?(@.price==22.99)].author'),
CUSTOM_JSON_EXTRACT(x, '$..author'),
CUSTOM_JSON_EXTRACT(x, '$.store.*'),
CUSTOM_JSON_EXTRACT(x, '$.store..price'),
CUSTOM_JSON_EXTRACT(x, '$..book[(@.length-1)]'),
CUSTOM_JSON_EXTRACT(x, '$..book[-1:]'),
CUSTOM_JSON_EXTRACT(x, '$..book[0,1]'),
CUSTOM_JSON_EXTRACT(x, '$..book[:2]'),
CUSTOM_JSON_EXTRACT(x, '$..book[?(@.isbn)]')
FROM t
结果如下
对于CUSTOM_JSON_EXTRACT(x, '$.store.book[*].author')
[
"Nigel Rees"
"Evelyn Waugh"
"Herman Melville"
"J. R. R. Tolkien"
]
对于CUSTOM_JSON_EXTRACT(x, '$..*[?(@.price==22.99)].author')
[
"J. R. R. Tolkien"
]
对于CUSTOM_JSON_EXTRACT(x, '$.store..price')
[
8.95
12.99
8.99
22.99
19.95
]
等等...
正如你所看到的 - 现在你可以使用通配符和过滤器和所有爵士乐:o)
支持的元素位于链接到的部分的表格中。具体而言,它包括$
,.
和[]
,其中后者可以是子操作符或下标(数组)操作符。如果没有列出,则不支持。
真的令人印象深刻,我不知道你可以用BQ做到这一点。谢谢! – Johan