star-schema

7热度

1回答

我有一个星型模式架构的数据库，我想在SQLAlchemy中表示。现在我遇到了如何以最好的方式完成这个问题。现在我有很多自定义连接条件的属性，因为数据存储在不同的表中。这将是很好，如果有可能重新使用不同的事实tablesw维度，但我还没有想出如何可以做得很好。

4热度

4回答

星型架构命名约定

在星型架构中将表作为维度还是事实表的前缀常见做法？列表名称前面加上列名也是常见的做法吗？在我的正常OLTP数据库中，我没有这样做，但是我在星型模式中看到了这种类型命名的例子。对于数据仓库模式与OLTP模式有一组不同的命名标准是否有意义？感谢德怀特

1热度

9回答

报表工具OLAP，*不* OLTP！

我正在寻找一种可以放在已有的OLAP星型模式之上的控件，以允许用户定义他们自己的“查询”并生成报告。现在我有一些建立在立方体顶部的预定义报告，但是我想让用户根据我创建的立方体来定义他们自己的标准。我发现许多产品可以让你像OLAP多维数据集一样处理一个事务表，但没有专门用于预先存在的多维数据集。编辑：让我清楚，我知道有无数的报告工具，声称报告OLAP多维数据集。问题是他们都假设他们正在查看事务数据

1热度

2回答

星型架构设计 - 一列尺寸

我对数据仓库很陌生，但我认为我的问题可以相对容易地回答。我构建了一个具有维度表'产品'的星型模式。该表有一个'PropertyName'列和'PropertyValue'列。尺寸因此看起来有点像这样： surrogate_key | natural_key (productID) | PropertyName | PropertyValue | ... 1 5 Si

5热度

4回答

Pentaho ETL和数据分析器是不错的选择吗？

我正在寻找ETL工具，并在谷歌上发现了很多关于Pentaho Kettle的信息。我还需要一个数据分析器才能在星型模式上运行，以便业务用户可以玩耍并生成任何类型的报告或矩阵。 PentaHo分析仪再次看起来不错。应用程序的其他部分将用java开发，应用程序应该是数据库不可知的。是Pentaho足够好还是有其他工具我应该检查。

4热度

4回答

星型模式：为客户和非客户分别维度或为服务员分享维度？

我是新来的模型明星模式，从阅读Data Warehouse Toolkit新鲜。我有了客户和非客户机调用到会与我们的一些员工的调用业务流程。我的事实表，把它称为“观众”，将包含的参加人是如何长的连接到呼叫的措施，而这个人的连接呼叫的成本。谷物是“与电话会议的单独连接”。我应该用我的贴合的客户维度，创建非客户机尺寸（对于那些还没有客户来电者）这样（省略尺寸是不是这个问题的一部分）： First

1热度

1回答

数据仓库：建模工作量分配

我们有一个系统可以跟踪工作单元的分配情况，从接收该工作单元直至完成该工作单元。一个工作单元有许多属性，它的来源，类型等等。这些我可以很好地用于建模，可能是事实的维度，或者只是属性的大小取决于它们的性质以及我们的方式用户将希望报告他们。问题是分配。工作单元可能流过多个团队，在这些团队中它可能流经多个人。可以对该单位的工作采取行动。我们的用户将有兴趣报道此事。例如，在特定时间段内按团队分配了

9热度

8回答

如何有效地利用10多台计算机导入数据

我们有> 200,000,000行的平面文件（CSV），我们将其导入包含23个维度表的星型模式。最大的维度表有300万行。目前我们在一台计算机上运行导入过程，大约需要15个小时。由于这段时间太长，我们想利用40台电脑等东西进行导入。我的问题我们怎样才能有效地利用40台电脑做进口。主要担心的是，在所有节点上复制维度表需要花费大量时间，因为它们在所有节点上需要保持一致。这可能意味着，如果我们将来使

2热度

4回答

如何避免星型模式中的复杂连接？

我的事实表在他参加的课程中包含用户分数。我必须在报告中展示的一些课程细节来自多个表格（在实际的OLTP db中）。我是否在维度表中创建该课程条目的非规范化版本？还是我只是直接加入事实表的课程表连接，以介绍这门课程（course_type，教师谁创造了这门课程等）

4热度

2回答

插入星型模式

我已经读了很多关于星型模式，关于事实/ deminsion表，选择语句以快速报告数据，但是数据输入到星型模式的问题似乎对我而言并不重要。 “理论上”如何将数据输入到星型模式数据库？同时维护事实表。在巨大的存储过程中有一系列的INSERT INTO语句，其中20个参数是我唯一的选择（以及如何填充事实表）。非常感谢。