我是新来的R,和我已经训练有素使用hclust
模型:聚类训练数据后,如何预测新数据的聚类?
model=hclust(distances,method="ward”)
而结果看起来不错:
现在,我得到了一些新的数据记录,我想要预测他们每个人属于哪个集群。我如何完成它?
我是新来的R,和我已经训练有素使用hclust
模型:聚类训练数据后,如何预测新数据的聚类?
model=hclust(distances,method="ward”)
而结果看起来不错:
现在,我得到了一些新的数据记录,我想要预测他们每个人属于哪个集群。我如何完成它?
正如名称所示,群集不应该对新数据进行“分类” - 它是分类的核心概念。
某些聚类算法(如基于质心的kmeans,kmedians等)可以基于创建的模型“标记”新实例。不幸的是,层次聚类不是其中之一 - 它不会分割输入空间,它只是“连接”聚类过程中给出的一些对象,因此您无法将新点指定给此模型。
使用hclust进行“分类”的唯一“解决方案”是在由hclust给出的标记数据之上创建另一个分类器。例如,您现在可以训练knn(即使k = 1)数据与hclust标签上的数据,并使用它将标签分配给新点。
伟大的'knn'值得尝试。 – MrROY
您可以使用此分类,然后使用LDA来预测新点应属于哪个类。
你所描述的听起来更像是分类。例如,参见[package class]中的'knn(...)'函数(http://cran.r-project.org/web/packages/class/class.pdf)。 – jlhoward
@MrROY你是怎么用knn解决问题的?你有一个例子吗? – loki
这使用knn https://www.rdocumentation.org/packages/arules/versions/1.5-0/topics/predict – Chris