用于所有数据或每个功能的k-means？

我想用k-means离散化两个值（0或1）中的时间序列数据。我的时间序列数据是每个基因的矩阵时间（line = time，column = gene）。例如：用于所有数据或每个功能的k-means？

t\x x1 x2 x3 
1 0.122 0.324 0.723 
2 0.543 0.573 0.329 
3 0.901 0.445 0.343 
4 0.612 0.353 0.435 
5 0.192 0.233 0.023

我的问题：我应该使用k个簇为每列（所以我将每列累加k.number_columns k个聚类）矩阵的所有数据或k个簇？我的基因是独立个体

2017-02-15 realbas

两者都可以工作。

一次剥离所有属性的好处是每次只给出一个符号，即单变量系列。

但另一方面，如果列是独立的，如果你单独分离它们，质量可能会更好。请注意，对于一维数据，如果有噪声，分位数可能比k-均值（对噪声敏感）好得多。

2017-02-15 08:29:19

谢谢。我对此表示怀疑。我将单独分离 – realbas

回答