2016-07-14 31 views
4

有关于在python k均值聚类问题。如何添加一列k均值预测集群的数据帧在Python

所以,我做的分析,这种方式:

from sklearn.cluster import KMeans 

km = KMeans(n_clusters=12, random_state=1) 
new = data._get_numeric_data().dropna(axis=1) 
kmeans.fit(new) 
predict=km.predict(new) 

我怎么能与聚类结果列添加到我的第一个数据帧的“数据”作为一个附加列?谢谢!

+1

所以你基本上是问如何将列添加到数据帧?如在:http://stackoverflow.com/questions/12555323/adding-new-column-to-existing-dataframe-in-python-pandas或这里http://stackoverflow.com/questions/18942506/add-new -column功能于大熊猫,数据帧蟒蛇 –

回答

5

假设列长度是一样的,你数据帧df每一列,所有你需要做的是这样的:

df['NEW_COLUMN'] = Series(predict, index=df.index)