python-wise中实现predict_proba(X)等价的Scikit-Learn我更喜欢.predict_proba(X)而不是.decision_function(X),因为它更容易解释结果。就我所见,后者的功能已经在Spark中实现了(好吧,在版本0.9.2中,例如我必须自己计算点积,否则我得到0或1),但前者尚未实现(还!)。我该怎么做\如何在Spark中实现那个呢?这里需要的输入是什么以及公式如何?如何在MLlib
Q
如何在MLlib
1
A
回答
0
在Spark/Mlib 1.3版中,似乎预测函数可以通过清除阈值返回概率。 从这个页面:https://spark.apache.org/docs/1.3.0/api/python/pyspark.mllib.html#module-pyspark.mllib.classification
>>> data = [
... LabeledPoint(0.0, [0.0, 1.0]),
... LabeledPoint(1.0, [1.0, 0.0]),
... ]
>>> lrm = LogisticRegressionWithSGD.train(sc.parallelize(data))
>>> lrm.predict([1.0, 0.0])
1
>>> lrm.predict([0.0, 1.0])
0
>>> lrm.predict(sc.parallelize([[1.0, 0.0], [0.0, 1.0]])).collect()
[1, 0]
>>> lrm.clearThreshold()
>>> lrm.predict([0.0, 1.0])
0.123...
if self._threshold is None:
return prob
else:
return 1 if prob > self._threshold else 0
我希望帮助。
相关问题
- 1. 如何在Scala Spark中获得StratifiedKFold MLLib
- 2. 如何将Hive表转换为MLlib LabeledPoint?
- 3. 如何提供Spark MLlib模型?
- 4. java apache spark mllib
- 5. Spark MLLIB问题
- 6. mllib KernelDensity错误
- 7. MLlib和pyspark功能
- 8. datastax,星火,和MLLIB
- 9. Spark mllib ALS建议
- 10. 结合Spark Streaming + MLlib
- 11. 如何在Spark MLLib中进行多目标线性回归?
- 12. 如何在Mllib中工作时保留记录信息
- 13. 如何在web项目中使用spark mllib
- 14. 如何在PySpark中自定义估算器mllib
- 15. Spark MLLib如何在训练分类器时忽略要素
- 16. 如何在CBOW模式下运行MLlib的word2vec?
- 17. 如何在Spark MLlib中执行基于用户的建议?
- 18. 如何在数据库中保存Spark MLlib模型?
- 19. 在Mac OS X上安装Spark MLLib
- 20. OutOfBoundsException与ALS - 弗林克MLlib
- 21. mllib矢量的最大值?
- 22. 统计星火mllib DecisionTree
- 23. 从Spark上使用Breeze MLlib
- 24. Spark MLlib IDF洗牌数据?
- 25. 生成关键字和mllib
- 26. 与MLlib一起使用DataFrame
- 27. 火花mllib应用功能
- 28. 列星火MLlib变换
- 29. 星火MLlib 0.91 org.jblas.DoubleMatrix错误
- 30. Spark mllib洗牌数据