0
- 从笔记本UI
- 运行Databricks社区版火花集群试图培养NaiveBayes一个小小的数据样本时,面对这个错误的正确用法 - 类型错误:不受约束的方法并行化()必须与 SparkContext实例作为第一个参数来调用(代替了列表实例)
代码:什么方法并行化星火模块pyspark.mllib.classification
from pyspark.mllib.classification import LabeledPoint, NaiveBayes from pyspark import SparkContext as sc data = [ LabeledPoint(0.0, [0.0, 0.0]), LabeledPoint(0.0, [0.0, 1.0]), LabeledPoint(1.0, [1.0, 0.0])] model = NaiveBayes.train(sc.parallelize(data)) model.predict(array([0.0, 1.0])) model.predict(array([1.0, 0.0])) model.predict(sc.parallelize([[1.0, 0.0]])).collect()
谢谢乔希罗森。这解决了这个问题。 –