我正在为建议培训ALS模型。我从约1000万用户和3米产品获得约200米的收视率。我有一个拥有48个内核和120gb集群内存的小型集群。Spark mllib ALS建议
我的代码非常类似于示例代码 spark/examples/src/main/scala/org/apache/spark/examples/mllib/MovieLensALS.scala代码。
我有几个问题:
所有步骤高达模型训练运行速度相当快。模型训练在20分钟内不到10分钟。然而,model.recommendProductsForUsers步骤要么很慢,要么只是不起作用,因为代码似乎在这一点上悬而未决。我试过用户和产品模块大小为-1和20,40等,用执行器内存大小等进行播放。有人可以在这里说明什么可能是错误的?
此外,是否有ml.recommendation.ALS算法的任何示例代码?我可以弄清楚如何训练模型,但我不明白(从文档)如何执行预测?
感谢您提供任何信息。
非常感谢。这非常有帮助。 –