我正在重构我的代码以充分利用DataFrames, Estimators, and Pipelines。我最初在RDD[LabeledPoint]
上使用MLlib Multiclass LogisticRegressionWithLBFGS。我很享受学习和使用新的API,但我不确定如何保存我的新模型并将其应用于新数据。Spark ML - 保存OneVsRestModel
目前,LogisticRegression
的ML实现仅支持二进制分类。我,而不是使用OneVsRest像这样:
val lr = new LogisticRegression().setFitIntercept(true)
val ovr = new OneVsRest()
ovr.setClassifier(lr)
val ovrModel = ovr.fit(training)
现在,我想救我OneVsRestModel
,但这似乎并没有受到API的支持。我曾尝试过:
ovrModel.save("my-ovr") // Cannot resolve symbol save
ovrModel.models.foreach(_.save("model-" + _.uid)) // Cannot resolve symbol save
有没有办法保存这个,所以我可以加载它在一个新的应用程序进行新的预测?
我希望我能+2这个。这不仅仅是我所需要的,它使计算原始概率的工作变得更容易。我以为我将不得不自定义src。谢谢! –
@ zero323是否有您的答案的pyspark版本?试图找到一种方法来保存pyspark.ml模型 – ajkl
@AjinkyaKale在1.6? – zero323