2017-10-10 41 views
0

我是星型模式的新手,对于要包含哪些变量感到困惑。假设我有一些电影的数据框,列包括导演,演员,评级,评论,流派等信息。如果我想制作一个星型模式,我是否应该尝试包括所有列?有人可以向我解释这个吗?谢谢。在星型模式中包含所有内容吗?

+0

您有什么要求?你应该包括你的客户/用户需要的东西。如果你不知道那是什么,那么这里没有人能帮助你。 – sqlvogel

+0

你似乎在寻求关于星型模式的教程。网上有教程。如果您想知道如何分析数据,请查看多维数据建模。 –

回答

1

这么多的方式来回答这个问题,因为它取决于你的开发组织,该解决方案:)

例如接收器,你可以只包括那些对您所支持的业务流程的重要属性。在销售数据集市中,您可能包括销售代表,但不包括他的鞋号。那么,除非公司销售鞋子......

你可以只包括你可以可靠地测试和验证的属性。这可能看起来很僵化,但取决于您的组织,它可能为您节省大量支持工作...

您只能包含用户社区特定请求的属性。通过这种方式,总是有可用信息的日志,为什么可用以及是谁请求它。

但是,我认为把你拥有的所有东西都包括在内是一个不错的主意。

很明显,您将根据您的组织使用上述组合。

+0

感谢您的回答。如果我现在只想创建一个用于查询和搜索的数据库,并且我不知道我会解决什么样的问题,那么,我应该包括所有的东西吗? – efsee

+0

通常情况下,我们建立的东西,因为我们需要它,所以正常的规则不适用于这里:) 在更严重的说明,从一个事实表开始,支持最重要的业务流程,并从那里开始 – Ronnis

+0

从理解事实和维度,而不是用想要建模的最简单的事件开始您的设计。 –