坚持和重复使用经过训练的机器学习模型的任何建议/最佳实践?我正在用Python或R开发模型。然后,这些模型必须用于评分生产工作流程(其中R不可用)。例如,可以在R中训练一个逻辑回归模型。现在需要根据这个模型对新的观察结果进行评分。评分引擎必须快速且可扩展。我想过以下机器学习模型持久性选项
PMML(http://en.wikipedia.org/wiki/Predictive_Model_Markup_Language)。很容易将R中开发的大多数模型转换为pmml。但是,我找不到PMML模型的有用评分引擎。例如,有augustus(https://code.google.com/p/augustus/),但它只实现了3-4个模型。
在Python中使用pickle序列化模型,并使用Python编写消费者。
有关正确方法的任何想法/建议?
您需要使用哪种型号? – pacoid
@ pacoid:主要回归模型(线性和逻辑)和基于树的模型。 – hssay