2017-04-20 45 views
-1

按照作为sklearn kmeans documentation聚类,它说,k-均值需要形状=(N_SAMPLES次,n_features)的基质中。但是我提供了shape =(n_samples,n_samples)的距离矩阵,其中每个索引都保存两个字符串之间的距离。时间序列已使用SAX表示法转换为字符串。传距离矩阵到k-指sklearn

当我跑了距离矩阵集群,它提供了良好的效果。这可能是什么原因?据我所知,K-medoids是与距离矩阵一起工作的。

回答

1

K均值,顾名思义,使用装置

计算的算术平均值需要访问原始特征,不能使用的距离矩阵。

K-手段也不使用成对距离。所以距离矩阵对于这个算法是无用的。

选择不同的算法来代替,如层次聚类。