我需要对使用k-means聚类的多维数据集数据集执行维数降低。数据包含从传感器读取放置在触觉手套上的传感器读取的正负实数。而代表说画字母“A”为Matlab:聚类中的问题
0.1373 -1.8764
-1.7020 -0.8322
0.4862 0.8276
-0.0078 1.3597
0.9008 1.8043
2.9751 0.7125
-0.3257 0.1754
现在的动作捕获数据,我的困惑是
- 我用下面的代码
K=3; load('b2.txt'); data = b2; numObservarations = length(data); %% cluster opts = statset('MaxIter', 500, 'Display', 'iter'); [clustIDX, clusters, interClustSum, Dist] = kmeans(data, K, 'options',opts, ... 'distance','sqEuclidean', 'EmptyAction','singleton', 'replicates',3); %% plot data+clusters figure, hold on scatter3(data(:,1),data(:,2),data(:,3), 50, clustIDX, 'filled') scatter3(clusters(:,1),clusters(:,2),clusters(:,3), 200, (1:K)', 'filled') hold off, xlabel('x'), ylabel('y'), zlabel('z')
如何纠正呢?什么是错?
在所有维度获得簇后,我现在表示由其群集标签数据作为
等。
- 此数据是否包含事件的时间顺序?通过扫视它,但有些论文说聚类不考虑时间顺序。
- 我需要减少它的长度。我知道主成分分析,但用于选择维度并且不减少数据长度。使用这种缩小格式进行基于距离的分类使用传入测试数据集合理吗?
首先,'数据= B2(100 1)用下面的代码生成
的副区这是一个不是2D的聚类问题。也许有一些关于你的数据看起来像什么的想法,我们可以帮助更多... –
对不起,这是一个错字。我删除了该数据,并添加了少量的数据样本。仍然没有阴谋 –
你能告诉我们什么是规模(数据)的输出? – prgao