第k中心点划分在克拉拉()函数使用距离形成簇,所以我得到这种模式:如何用趋势而不是按R中的距离进行聚类?
a <- matrix(c(0,1,3,2,0,.32,1,.5,0,.35,1.2,.4,.5,.3,.2,.1,.5,.2,0,-.1), byrow=T, nrow=5)
cl <- clara(a,2)
matplot(t(a),type="b", pch=20, col=cl$clustering)
但我想找到分配一个群集于每行一个聚类方法根据它的趋势,第1,2和3行属于一个集群,第4行和第5行属于另一集群。
这与@joran提出的有何不同?我可能没有看到差异 – nachocab
刚读完他的回答:不,这并没有太大的不同。我建议采用不同的缩放比例。 但是,我想指出的重点是,这属于预处理的重要步骤,您不能忽视。这就是为什么总是谈论KDD过程的原因:https://en.wikipedia.org/wiki/Data_mining#Process 这是实际开采中90%的努力,最多只有5%的科学结果,专注于新算法。 –