2012-02-14 58 views
0

我有一个查询应该很简单,但它会导致我很多头痛。 我有一个简单的广告系统,需要根据几个变量过滤广告。 我需要限制每天观看次数/点击次数以及给定广告的总观看次数/点击次数。此外,每个广告都与广告可以展示的一个或多个广告位相关联。我有一张表格,可以保存每个广告所需的统计信息。请注意,统计信息表变化非常频繁。 这些是我使用的表格:SQL:重构多连接查询

CREATE TABLE `t_ads` (
    `id` int(10) unsigned NOT NULL auto_increment, 
    `name` varchar(255) NOT NULL, 
    `content` text NOT NULL, 
    `is_active` tinyint(1) unsigned NOT NULL, 
    `start_date` date NOT NULL, 
    `end_date` date NOT NULL, 
    `max_views` int(10) unsigned NOT NULL, 
    `type` tinyint(3) unsigned NOT NULL default '0', 
    `refresh` smallint(5) unsigned NOT NULL default '0', 
    `max_clicks` int(10) unsigned NOT NULL, 
    `max_daily_clicks` int(10) unsigned NOT NULL, 
    `max_daily_views` int(10) unsigned NOT NULL, 
    PRIMARY KEY (`id`) 
) ENGINE=InnoDB DEFAULT CHARSET=latin1; 

CREATE TABLE `t_ad_slots` (
    `id` int(10) unsigned NOT NULL auto_increment , 
    `name` varchar(255) NOT NULL, 
    `width` int(10) unsigned NOT NULL, 
    `height` int(10) unsigned NOT NULL, 
    PRIMARY KEY (`id`) 
) ENGINE=InnoDB DEFAULT CHARSET=latin1; 

CREATE TABLE `t_ads_to_slots` (
    `ad_id` int(10) unsigned NOT NULL, 
    `slot_id` int(10) unsigned NOT NULL, 
    `value` int(10) unsigned NOT NULL, 
    PRIMARY KEY (`ad_id`,`slot_id`), 
    KEY `slot_id` (`slot_id`) 
) ENGINE=InnoDB DEFAULT CHARSET=latin1; 


ALTER TABLE `t_ads_to_slots` 
    ADD CONSTRAINT `t_ads_to_slots_ibfk_1` FOREIGN KEY (`ad_id`) REFERENCES `t_ads` (`id`) ON DELETE CASCADE ON UPDATE NO ACTION, 
    ADD CONSTRAINT `t_ads_to_slots_ibfk_2` FOREIGN KEY (`slot_id`) REFERENCES `t_ad_slots` (`id`) ON DELETE CASCADE ON UPDATE NO ACTION; 

CREATE TABLE `t_ad_stats` (
    `ad_id` int(10) unsigned NOT NULL, 
    `slot_id` int(10) unsigned NOT NULL, 
    `date` date NOT NULL COMMENT, 
    `views` int(10) unsigned NOT NULL, 
    `unique_views` int(10) unsigned NOT NULL, 
    `clicks` int(10) unsigned NOT NULL default '0', 
    PRIMARY KEY (`ad_id`,`slot_id`,`date`), 
    KEY `slot_id` (`slot_id`) 
) ENGINE=InnoDB DEFAULT CHARSET=latin1; 


ALTER TABLE `t_ad_stats` 
    ADD CONSTRAINT `t_ad_stats_ibfk_1` FOREIGN KEY (`ad_id`) REFERENCES `t_ads` (`id`) ON DELETE CASCADE ON UPDATE NO ACTION, 
    ADD CONSTRAINT `t_ad_stats_ibfk_2` FOREIGN KEY (`slot_id`) REFERENCES `t_ad_slots` (`id`) ON DELETE CASCADE ON UPDATE NO ACTION; 

这是我用对给定插槽(注意获取广告查询,在这个例子中,我硬编码的20插槽ID和0,1 ,2作为广告类型,我从一个PHP脚本调用该查询得到这个数据)

SELECT  `ads`.`content`, `slots`.`value`, `ads`.`id`, `ads`.`refresh`, `ads`.`type`, 
      SUM(`total_stats`.`views`) AS "total_views", 
      SUM(`total_stats`.`clicks`) AS "total_clicks" 
FROM  (`t_ads` AS `ads`, 
      `t_ads_to_slots` AS `slots`) 
LEFT JOIN `t_ad_stats` AS `total_stats` 
ON   `total_stats`.`ad_id` = `ads`.`id` 
LEFT JOIN `t_ad_stats` AS `daily_stats` 
ON   (`daily_stats`.`ad_id` = `ads`.`id`) AND 
      (`daily_stats`.`date` = CURDATE()) 
WHERE  (`ads`.`id` = `slots`.`ad_id`)   AND 
      (`ads`.`type` IN(0,1,2))     AND 
      (`slots`.`slot_id` = 20)    AND 
      (`ads`.`is_active` = 1)     AND 
      (`ads`.`end_date` >= NOW())    AND 
      (`ads`.`start_date` <= NOW())   AND 
      ((`ads`.`max_views` = 0) OR 
      (`ads`.`max_views` > "total_views")) AND 
      ((`ads`.`max_clicks` = 0) OR 
      (`ads`.`max_clicks` > "total_clicks")) AND 
      ((`ads`.`max_daily_clicks` = 0) OR 
      (`ads`.`max_daily_clicks` > IFNULL(`daily_stats`.`clicks`,0))) AND 
      ((`ads`.`max_daily_views` = 0) OR 
      (`ads`.`max_daily_views` > IFNULL(`daily_stats`.`views`,0))) 
GROUP BY (`ads`.`id`) 

我相信这个查询是自我解释,即使它很长。请注意,我使用的MySQL版本是:5.0.51a-community。在我看来,这里最大的问题是对统计表的双重连接(我这样做,以便能够从特定记录和多个记录(总和)中获取数据)。

如何实现此查询以获得更好的结果? (请注意,我无法从InnoDB更改)。

希望一切都清楚我的问题,但如果情况并非如此,请问,我会澄清。 由于提前, 幼狮

+0

准确的头痛原因是什么?我会假设表现,但...请澄清。 – 2012-02-14 22:10:18

+1

当你混合使用ANSI-86和ANSI-92风格的连接时,难以阅读SQL。你也可以让'(ads.id = slots.ad_id)'为INNER JOIN。 – 2012-02-14 22:11:25

+2

试图运行此查询应该实际上导致错误。您的GROUP BY列出了ads.id,但您的SELECT列出了另外4个非聚合字段。 – 2012-02-14 22:17:43

回答

0

添加索引到以下栏目:

t_ads.is_active 
t_ads.start_date 
t_ads.end_date 

更改主键的上t_ad_stats顺序:

(`ad_id`,`date`,`slot_id`) 

或添加一个覆盖索引,以t_ad_stats

('ad_id', 'date') 

从变更,意思是“没有限制”,以2147483647意味着没有限制,所以你可以改变的事情,如:

((`ads`.`max_views` = 0) OR (`ads`.`max_views` > "total_views")) 

(`ads`.`max_views` > "total_views") 

您可以大大提高,这是如果你保持运行总和,而不必到每次计算它们。

0

在评论扩展上面我认为有以下列应被索引:

ads.id 
ads.type 
ads.start_date 
ads.end_date 
daily_stats.date 

除了这些:

slots.slot_id 
ads.is_active 

而这些也:

ads.max_views 
ads.max_clicks 
ads.max_daily_clicks 
ads.max_daily_views 
daily_stats.clicks 
daily_stats.views 

请注意,在这些列上应用索引将加速您的SELECT,但会减慢自第i个以来的INSERT ndexes也需要更新。但是,您不必一次全部应用所有这些。您可以逐步完成,并查看性能如何选择以及插入。如果你找不到一个好的中间场地,那么我会建议反规范化。