我有一个数据矩阵作为以下给出..我应该使用哪种聚类技术?
它是用户访问matrix..each行代表用户和每列表示由该用户访问的网页的类别。
0 8 1 0 0 8 0 0 0 0 0 0 0 11 2 2 0
1 0 7 0 0 0 0 0 1 1 0 0 0 0 0 0 1
1 0 1 1 0 0 0 0 0 1 0 0 0 1 0 0 0
6 1 0 0 0 2 6 0 0 0 0 1 0 0 0 0 0
5 3 2 0 2 0 0 0 0 0 1 0 0 0 1 0 0
2 3 0 1 0 1 0 0 0 0 0 1 0 3 0 0 0
9 0 1 1 0 0 5 0 0 0 1 2 0 0 0 0 0
5 1 4 0 0 0 1 0 0 2 0 0 0 9 0 0 0
5 5 0 2 0 1 0 0 0 0 1 1 0 0 0 0 0
1 2 0 0 2 3 3 0 0 1 1 0 0 0 4 0 0
0 1 0 1 0 2 0 0 1 0 0 0 0 2 0 0 0
5 4 0 0 1 0 0 0 0 0 1 0 0 2 0 0 0
0 0 0 2 0 0 2 12 1 0 0 0 2 0 0 0 0
6 1 0 0 0 0 58 15 7 0 1 0 0 0 0 0 0
1 0 2 0 0 1 1 0 0 0 2 0 0 0 0 0 0
我需要在其上应用biclustering技术。 这种双聚类技术将首先生成用户群集,然后生成页面群集。之后,它将用户和页面群集结合起来以生成双聚类。 现在我很困惑我应该为此使用哪种聚类技术。 最好的聚类将从这个矩阵生成相干双聚类。
您是否有理由需要双集群数据,而不仅仅是分析?这是解决矩阵问题的数学解决方案,而不是程序化解决方案。 –
看看[Apache Mahout](https://mahout.apache.org/),他们有很多[算法](https://mahout.apache.org/users/basics/algorithms.html)可能适合您的需求。 – sp00m
是的,我正在处理网络日志数据的双重聚合..我已经从这些数据生成了这个矩阵..但是现在关于聚类方法来执行双聚类。 – Pratts