2013-07-31 114 views
0

我在hadoop中使用Mahout进行数据挖掘算法。但在某些情况下它有问题。是否有任何其他数据挖掘库与hadoop一起使用? 谢谢。hadoop的数据挖掘库

+0

我个人没有发现比Mahout更好的用例。恕我直言,仅仅因为很少的错误而转换好的东西并不是一件明智的事情。如果是这样的话,那么有一天你会对Hadoop提出同样的问题。这个世界上的软件是100%免费的错误? – Tariq

+0

您确定需要Hadoop支持吗?您可以使用Hadoop加载和预处理数据,然后在单个节点上对其进行分析。除非您有Google缩放数据,否则这可能会起作用(速度会更快)。 –

回答

1

为什么不使用Spark?它是一个非常高效的开源集群计算系统,既快速运行又快速写入。对于分布式数据挖掘,Spark是一个非常好的工具。

希望帮助!