2017-02-13 42 views
0

我是数据库新手,我对k-means(或任何)聚类算法有更多的理论问题。在这一刻,我正试图根据行为数据进行客户细分。我们设计的一些属性,如: - 即一个客户购买销售的产品, 百分比 - 的产品,平均每一次 - 每个产品 平均价格 - 和其他几个人 - 购买产品的商店 的频率。按客户群分组

我们正在努力完成的是一群彼此行为相似的客户,因此我们可以根据他们的偏好与他们沟通。问题在于,我不确定聚类的结果是否能给我们提供合适的分段。可能会确定其他类似的行为,但不适合实际使用。

我的问题如下;使用分类器算法会更好吗,这样我可以确定目标变量,还是应该使用聚类算法?如果我必须选择一种聚类算法,那么减少属性数量会更好吗,所以我对结果的使用方式有了更多的控制权?

我希望你们能帮我解决这个概念问题。

回答

0

如果你可以使用分类,那么总是使用分类。

聚类是脆弱的,不是一个非常明确的问题。您不想将业务构建到集群算法上。