0
我知道Knn有一个问题在处理高维数据时知道“维度的诅咒”,它的理由是它包含计算距离时的所有特征,即欧氏距离,其中非重要特征充当噪声并偏向结果,但是我不明白几件事情距离度量度量对K近邻维数的影响?
1)余弦距离度量如何受这个维度问题的影响,即我们将余弦距离定义为cosDistance = 1- cosSimilarity其中cosSimilarity对于高维数据是有利的,所以余弦距离可能如何受到维度问题的诅咒?
2)我们可以给weka指定任何权重,或者我可以将特征选择应用到KNN本地吗?局部到knn意味着我编写自己的K-NN类,其中在分类i中首先将训练实例转换为较低维度,然后计算测试实例邻居?