2015-10-02 122 views
1

我有一个分类任务。我想用apache spark ml lib SVM算法进行分类。我输入的是n维的数据。在特征向量中,某些维度可能会丢失。在apache spark中处理SVM中的缺失值ML Lib

如何处理缺失值?我认为我错了将缺失值假设为零或其他东西。

回答

0

你有两个选择: 1-缺失值 2-省略载体只是填充缺失值,你可以使用平均值或模式值

我会建议做的火花,是非常简单的代码,这里有一个例子:

example