2016-03-09 53 views
1

我使用Spark MLLib在LabeledPoints的RDD上进行SVM分类。 我想交叉验证它。哪种做法最好? 有没有人有一个示例代码?我发现CrossValidator类依赖于DataFrame。Spark MLLib SVM的交叉验证

我的目标是获得F分数。

回答

0

你可以找到一个完整的例子on Spark's github,但不支持SVM,但逻辑回归。

最好的方法是使用rdd.toDF()方法将RDD更改为DataFrame。

+3

感谢迄今。在这个例子中,一个LogisticRegression对象被实例化并插入到管道中。它找不到任何SVM来实例化哪些适合流水线。使用哪个类? –