所以我使用了Weka机器学习库JAVA API ...在WEKA Java API的协同过滤推荐最有效的距离函数
我基本上使用StringToWordVector过滤字符串对象转换成他们的话构建这个协同过滤系统occurence分解....
所以现在我使用的kNN算法来找到最近的邻居到目标对象....
我的问题是,我应该用什么样的距离函数来计算之间的距离两个由StringToWordVector过滤器过滤的对象......哪一个将会是mo对这种情况有效吗?
在Weka中可用的选项是:
AbstractStringDistanceFunction, ChebyshevDistance, EditDistance, EuclideanDistance, ManhattanDistance, NormalizableDistance