2016-06-28 94 views
1

有没有多维层次聚类的东西?多维层次聚类 - python

我都对着这些地方:

,但没有成功,到目前为止

含义:查找组时相同的方式,是完成2维,但与multipl Ë尺寸

一些代码:

import pandas as pd 
import numpy as np 
set_of_values = pd.DataFrame(
    [np.random.rand(10), 
    np.random.rand(10), 
    np.random.rand(10), 
    np.random.rand(10), 
    np.random.rand(10),], 
    index=['temp differential', 'power differential', 'cost', 'time','output'], 
    columns=range(10)).transpose() 
print(set_of_values) 

我想找到(“温度差”,“权力差”,“成本”,“时间”,“输出”)中的所有集群。因为它是一个超平面。理想情况下使用[所有组]的输出:

GROUP #1: (a,b,c,d,e), (a',b',c',d',e'), ... , (a'',b'',c'',d'',e'') 
... 
GROUP #n: ('a,'b,'c,'d,'e), ('a,'b,'c,'d,'e), ... , (''a,''b,''c,''d,''e) 

给出了渐进式“聚类”的阈值。它可行吗?

回答

1

下面是一个简单的例子。在这里,这是集群4个随机变量的层次聚类:

%matplotlib inline 
import matplotlib.pylab as plt 
import seaborn as sns 
import pandas as pd 
import numpy as np 

df = pd.DataFrame({"col" + str(num): np.random.randn(50) for num in range(1,5)}) 
sns.clustermap(df) 

enter image description here

如果您关心理解树状联系和阈值来获得群集,seaborn工具使用SciPy的和this post将是有益的。

如果你想在空间可视化这一点,我建议采用主成分分析和绘图PC1 VS PC2 http://scikit-learn.org/stable/auto_examples/decomposition/plot_pca_iris.html

+0

这是什么IWAS寻找 – Asher11