1
我使用Spark MLLib在LabeledPoints的RDD上进行SVM分类。 我想交叉验证它。哪种做法最好? 有没有人有一个示例代码?我发现CrossValidator类依赖于DataFrame。Spark MLLib SVM的交叉验证
我的目标是获得F分数。
我使用Spark MLLib在LabeledPoints的RDD上进行SVM分类。 我想交叉验证它。哪种做法最好? 有没有人有一个示例代码?我发现CrossValidator类依赖于DataFrame。Spark MLLib SVM的交叉验证
我的目标是获得F分数。
你可以找到一个完整的例子on Spark's github,但不支持SVM,但逻辑回归。
最好的方法是使用rdd.toDF()
方法将RDD更改为DataFrame。
感谢迄今。在这个例子中,一个LogisticRegression对象被实例化并插入到管道中。它找不到任何SVM来实例化哪些适合流水线。使用哪个类? –