我有一个分类任务。我想用apache spark ml lib SVM算法进行分类。我输入的是n维的数据。在特征向量中,某些维度可能会丢失。在apache spark中处理SVM中的缺失值ML Lib
如何处理缺失值?我认为我错了将缺失值假设为零或其他东西。
我有一个分类任务。我想用apache spark ml lib SVM算法进行分类。我输入的是n维的数据。在特征向量中,某些维度可能会丢失。在apache spark中处理SVM中的缺失值ML Lib
如何处理缺失值?我认为我错了将缺失值假设为零或其他东西。
没错。 ML Lib不会推算缺失值,填充0会扭曲结果。但是,WEKA上有一个ReplaceMissingValues包,可能对您有用;这实现了一种插补算法。 http://weka.sourceforge.net/doc.stable/weka/classifiers/functions/LibSVM.html