2017-02-15 17 views
0

我想用k-means离散化两个值(0或1)中的时间序列数据。我的时间序列数据是每个基因的矩阵时间(line = time,column = gene)。例如:用于所有数据或每个功能的k-means?

t\x x1 x2 x3 
1 0.122 0.324 0.723 
2 0.543 0.573 0.329 
3 0.901 0.445 0.343 
4 0.612 0.353 0.435 
5 0.192 0.233 0.023 

我的问题:我应该使用k个簇为每列(所以我将每列累加k.number_columns k个聚类)矩阵的所有数据或k个簇?我的基因是独立个体

回答

0

两者都可以工作。

一次剥离所有属性的好处是每次只给出一个符号,即单变量系列。

但另一方面,如果列是独立的,如果你单独分离它们,质量可能会更好。请注意,对于一维数据,如果有噪声,分位数可能比k-均值(对噪声敏感)好得多。

+0

谢谢。我对此表示怀疑。我将单独分离 – realbas

相关问题