我有三个表:聚合函数连接表
CREATE TABLE foo (
id bigint PRIMARY KEY,
name text NOT NULL
);
CREATE TABLE foo_bar (
id bigint PRIMARY KEY,
foo_id bigint NOT NULL
);
CREATE TABLE tag (
name text NOT NULL,
target_id bigint NOT NULL,
PRIMARY KEY (name, target_id)
);
我试图创建一个视图,这样我得到的所有表foo
的领域,项目的foo_bar
其中foo.id = foo_bar.foo_id
计数,以及所有标签的文本数组,其中foo.id = tag.target_id
。如果我们有:
INSERT INTO foo VALUES (1, 'one');
INSERT INTO foo VALUES (2, 'two');
INSERT INTO foo_bar VALUES (1, 1);
INSERT INTO foo_bar VALUES (2, 1);
INSERT INTO foo_bar VALUES (3, 2);
INSERT INTO foo_bar VALUES (4, 1);
INSERT INTO foo_bar VALUES (5, 2);
INSERT INTO tag VALUES ('a', 1);
INSERT INTO tag VALUES ('b', 1);
INSERT INTO tag VALUES ('c', 2);
结果应该返回:
foo.id | foo.name | count | array_agg
--------------------------------------------------
1 | one | 3 | {a, b}
2 | two | 2 | {c}
这是我到目前为止有:
SELECT DISTINCT f.id, f.name, COUNT(b.id), array_agg(t.name)
FROM foo AS f, foo_bar AS b, tag AS t
WHERE f.id = t.target_id AND f.id = b.foo_id
GROUP BY f.id, b.id;
这是我得到的结果(注意count
是不正确的):
foo.id | foo.name | count | array_agg
--------------------------------------------------
1 | one | 2 | {a, b}
2 | two | 1 | {c}
count
始终是标记的计数,而不是不同的foo_bar
值的计数。我试过重新排序/修改GROUP BY
和SELECT
子句,它们会返回不同的结果,但不是我正在查找的结果。我认为我在array_agg()
函数中遇到了问题,但我不确定是否如此,或者如何解决它。
感谢您的详细解释! – Bill 2013-03-07 01:41:42
@ Bill:这应该是非常快的,即使是一百万行。但为什么猜测你是否可以测试?用100k行填充你的表,并用'EXPLAIN ANALYZE'运行查询。你可以找到一个例子[如何使用'generate_series()'轻松地在这里构建一个测试](http://stackoverflow.com/questions/15169410/how-do-you-do-date-math-that-ignores-the - 年/ 15179731#15179731)。 SO上还有更多。另外考虑我的答案的补充位。 – 2013-03-07 01:43:16
感谢球场,这就是我的兴趣所在。我一定会测试,但目前没有生产硬件,我的虚拟机测试不会产生有用的结果。我只需要知道这是否是一个明显可怕的想法,我应该立即纠正。再次感谢! – Bill 2013-03-07 01:48:32