2012-12-05 149 views
2

我们使用RevoRrmrrhadoop package。我们可以对整个数据在Hadoop中集进行线性回归,而无需实现在地图中的线性回归算法降低使用R和Hadoop进行Logistic回归

是RMR和rhadoop,只是用于汇总的数据,然后在运行回归在本地汇总数据?

回答

0

都没有。您可以在rmr中实现任何类型的算法,而不仅仅是摘要。然而,它不是一个算法包,因为它不包括线性回归或集群或任何类型的东西,就像包或平行或雪。

+0

谢谢。所以我们基本上需要手动编写代码来适应回归模型?例如,计算平均值,计算成本函数,应用梯度下降等等? – Victor

+0

我这么认为。可能存在某些问题,只能在映射器中计算独立解决方案,然后在缩小阶段合并它们。这种方法工作的一个例子是函数max:取任意子集的最大值,然后取最大值的最大值。对于平均值,只要权重适当,就可以做平均值的手段。对于线性回归,我不确定。 – piccolbo