2013-08-27 37 views
0

我在事实和维度表之间有点混淆,我无法清除我的疑问。事情是我必须设计一个模式,其中有一个关键字表。并且对应于每个关键字我们都有一个日期表和网站表(该关键字是为哪个网站生成的)。现在有这种情况下工作我很困惑哪些表被分配为事实和哪一个作为维表。关键字表格包含key_id和关键字名称。日期表格包含月份,年份和星期。网站表格包含关键字所属网站的名称。请向我建议此架构的架构。数据仓库和挖掘中的模式设计

回答

0

你在测量什么?

您是否正在计算为每个站点生成关键字的次数?所有这三个表都是维度(假设您的日期表中包含每个日期)。你需要另一张表,这是你的事实,它告诉你一天中关键字的产生次数(甚至是小时 - 你应该尽可能低)

换句话说 - 对于一个给定的网站,关键字是否可以在一周内多次生成?它在一周内产生了10次?这是你的事实表记录:

Date_SurrogateKey Site_SurrogateKey Keyword_SurrogateKey  GeneratedCount 
1     6     7       10 

在这个例子中,1加入到你的时间维度的主键,6加入到你的网站维度的主键和7连接到您的关键字维度的主键。