2011-06-20 17 views
2

这是我的用例:功能有可能成为聚类算法的列表吗?

我有网络资源和每个资源的一组视图。它来自网络导航,所以资源是您访问的内容,并且视图是实际访问。

对于每个视图,我都有关于位置的信息,查看当天的时间,以及我可以获得的信息,如视图的总数和在此资源上传递的时间。

我想查找此信息中的不同模式,以确定用户配置文件。如果对于每个资源我只有一个视图,可以很容易地对它们进行群集,但是由于我确实有很多视图,是否有一种方法可以使用此信息来更好地群集资源?

回答

1

如果我理解正确,您希望根据他们拥有的视图来聚集资源。为此,您可能需要根据视图的统计信息制作一个特征向量。例如,您的特征向量可以包括:总观看次数,观看者位置的标准差,观看日的平均时间,资源年龄等。然后,您可以将这些特征向量馈入聚类算法。您要使用的确切功能将取决于您对集群的使用情况。如果你想让集群反映资源的内容,并且资源是基于文本的,那么我会推荐使用bag of words

+0

谢谢,这正是我所期待的。我正在计算stdev,avg和其他指标,它的功能就像一个魅力。 –

0

很难说出你到底在问什么。是的,feature vectors被广泛用于机器学习算法。