0
我刚刚阅读了this关于使用Mahout进行逻辑回归的有趣文章。该教程对我来说很清楚......但真正的用例会如何?例如,当[网络]应用程序首次启动时,需要处理一些培训数据...并将结果保存在OnlineLogisticRegression
实例中。然后,为了测试新数据,只需调用OnlineLogisticRegression.classifyFull
并查看数据落入给定分类中的0到1 —之间的值表示的概率—。使用Mahout进行Logistic回归
但是如果我想改进一个模型并在[web]应用程序在线时使用附加数据进行训练呢?这个想法应该是每周一次或多次以类似的方式训练模型,以提高准确性。什么是实施这种机制的正确方法?是否有重大的性能问题?