2014-09-22 31 views
0

我正在通过this教程。一切都是可以理解的我,除了这部分:使用SSAS对简单数据集群进行聚类

enter image description here

什么是连接集群行的目的/意思?

随着教程状态,集群实际上是这样的,如果你绘制出来:

enter image description here

但我不理解连接集群行的目的。没有什么代码,这是隐含的关于​​被以某种方式连接的集群:

CREATE TABLE [dbo].[tblClusterExample](
    pkClusterExample int identity (1,1) primary key, 
[AttributeX] [decimal](18, 4) NOT NULL, 
[AttributeY] [decimal](18, 4) NOT NULL 
) ON [PRIMARY] 
GO 
insert into dbo.tblClusterExample values (rand()/10 +0.8, rand()/10 +0.8) 
insert into dbo.tblClusterExample values (rand()/10 +0.2, rand()/10 +0.8) 
insert into dbo.tblClusterExample values (rand()/10 +0.2, rand()/10 +0.2) 
insert into dbo.tblClusterExample values (rand()/10 +0.8, rand()/10 +0.2) 
go 10000 
select top 10 * from dbo.tblClusterExample 

哪里是我的理解的差距?

+0

对于Microsoft在其产品中使用的统计工具以及这些工具生成的数据背后的含义,存在严重缺乏良好文档的情况。我可以建议一本关于工具集使用的基础数学/统计技术的书或课程吗? – 2014-09-22 19:01:17

+0

请做一个 – 2014-09-22 19:11:57

+0

Coursera提供各种方法的入门课程 - https://www.coursera.org/course/datan – 2014-09-22 19:38:29

回答

2

也许如果你将鼠标悬停在线上,它可能会给出质心距离(我不确定)。我还没有使用过这个软件。但线条只是用于视觉解释。除非它们给出一些距离测量,它们是没有任何用处。