这里的主要问题是具有每一天全扫描。剩下的问题就更少了,并且可以很容易地被编写出来。client of your choice
所以,下面是 - 如何避免每一天的全表扫描?
尝试下面的步骤一步看方法
它是通用的,足以扩展/应用到你的实际情况 - 同时我使用同样的例子,你在你的问题,我限制的运动,只是10天
1步 - 创建透视表
在这一步中,我们一)压缩每一行的内容到记录/阵列和b)把他们全部纳入各自的“日报”列
#standardSQL
SELECT
ARRAY_CONCAT_AGG(CASE WHEN d = 'day20160101' THEN r END) AS day20160101,
ARRAY_CONCAT_AGG(CASE WHEN d = 'day20160102' THEN r END) AS day20160102,
ARRAY_CONCAT_AGG(CASE WHEN d = 'day20160103' THEN r END) AS day20160103,
ARRAY_CONCAT_AGG(CASE WHEN d = 'day20160104' THEN r END) AS day20160104,
ARRAY_CONCAT_AGG(CASE WHEN d = 'day20160105' THEN r END) AS day20160105,
ARRAY_CONCAT_AGG(CASE WHEN d = 'day20160106' THEN r END) AS day20160106,
ARRAY_CONCAT_AGG(CASE WHEN d = 'day20160107' THEN r END) AS day20160107,
ARRAY_CONCAT_AGG(CASE WHEN d = 'day20160108' THEN r END) AS day20160108,
ARRAY_CONCAT_AGG(CASE WHEN d = 'day20160109' THEN r END) AS day20160109,
ARRAY_CONCAT_AGG(CASE WHEN d = 'day20160110' THEN r END) AS day20160110
FROM (
SELECT d, r, ROW_NUMBER() OVER(PARTITION BY d) AS line
FROM (
SELECT
stn, CONCAT('day', year, mo, da) AS d, ARRAY_AGG(t) AS r
FROM `bigquery-public-data.noaa_gsod.gsod2016` AS t
GROUP BY stn, d
)
)
GROUP BY line
在web用户界面中使用pivot_table运行以上查询(您可以选择任意名称)作为目标
正如您所看到的 - 在此处我们将获得包含10列的表 - 每列一列,每个模式列是原始表中的模式的副本:
![enter image description here](https://i.stack.imgur.com/rLLaP.png)
步骤2 - 创建分片表一个接一个ONLY扫描各自的列(没有全表扫描)上述曲
#standardSQL
SELECT r.*
FROM pivot_table, UNNEST(day20160101) AS r
润从目标表中的Web UI红霉素命名mytable_20160101
您可以第二天运行相同
#standardSQL
SELECT r.*
FROM pivot_table, UNNEST(day20160102) AS r
现在你应该有目的地表命名mytable_20160102等
你应该能够自动/脚本这一步与您选择的任何客户端 注意:那些最终的日常表格将与原始表格具有完全相同的架构!
有如何,您可以使用上面的方法很多变化 - 它是由你的创造力
注:的BigQuery允许多达10000列在表中,因此365列了一年的各天绝对不是问题在这里:o)
@ daniel-barron - 如果答案帮助了你,你接受了它 - 请考虑投票。 '。投票答案即使已被接受或将被接受也是有帮助的。还有更多......当某人回答你的问题时,你可以查看该怎么做 - http://stackoverflow.com/help/someone-answers。 –