我正在研究kmeans集群。 我有3d数据集作为no.days,频率,食物 - >日是通过手段&标准偏差(标准差)或更好地说标准化。它给我的范围[-2至14]机器学习,标称数据标准化
- >频率和食物是我的数据集中的NOMINAL数据通过DIVIDE BY MAX(x/max(x))进行归一化,这使得范围[0到1]
问题是kmeans只考虑日轴进行分组,因为这个轴有明显的间隙b/w点,并且几乎忽略了频率和食物中的另外两个(我认为是因为可忽略不计的差距频率和食物变暗)。
如果我只在日轴上应用kmeans(1D),我会得到与我在3D上应用的完全相似的结果(天,频率,食物)。
“之前,我做了X/MAX(X),以及对天,但不能接受”
,所以我想知道有没有办法正常化频率和食品的另外两个标称数据,我们可以得到基于DAY轴的公平缩放。
食品=> 1,2,3 频率=> 1-36
你为什么没有正常化所有的东西? – Mornor
我规范化了每一件事情......因为我的定量数据和平均值和标准偏差都有意义,所以我使用标准化了......但是对于频率和食品来说它没有意义,因为它们是我的分类数据。 –