我想在Windows上运行的应用程序中使用Mahout。我想使用k-means从lucene索引构建集群。因为Hadoop会对Windows环境中未知的程序(例如chmod)进行命令行调用,所以只要我必须创建序列文件(从lucene索引创建向量),我就会得到一个Hadoop异常。在Cygwin中运行不是一种选择,因为我希望能够从eclipse运行App。如何在Windows环境中使用Mahout?
所以我的问题是
我想在Windows上运行的应用程序中使用Mahout。我想使用k-means从lucene索引构建集群。因为Hadoop会对Windows环境中未知的程序(例如chmod)进行命令行调用,所以只要我必须创建序列文件(从lucene索引创建向量),我就会得到一个Hadoop异常。在Cygwin中运行不是一种选择,因为我希望能够从eclipse运行App。如何在Windows环境中使用Mahout?
所以我的问题是
在Windows环境下运行Hadoop的唯一方法是安装Cygwin。欲了解更多信息,请参阅本博客文章:
http://hayesdavis.net/2008/06/14/running-hadoop-on-windows/
Cygwin的将提供所有的命令行实用程序(如文件模式),其Hadoop的依赖。如果需要,您仍然可以从Eclipse内部运行Hadoop作业。
您是否知道SequenceFile
API?看看这里:http://hadoop.apache.org/common/docs/current/api/org/apache/hadoop/io/SequenceFile.html 你可以尝试自己写/读数据。
我想你可以在Windowns中以独立模式运行eclipse中的Mahout。但你会出现几个短暂的障碍。你应该尝试你多远。
在我看来,你不应该坚持从日食中运行mahout。 ;-)
您可以使用虚拟机来运行Hadoop环境。 至于我,最好的解决方案是使用http://hortonworks.com/项目。 一切都很好。
借调,这是更多关于Hadoop的问题,并且不能在Windows上运行Hadoop。 – 2010-05-02 06:41:23
HDInsight是Windows Azure的Hadoop实现。如果您想在本地计算机上使用它,而不是在云中使用它,请尝试使用HDInsight仿真器,您可以使用Web Platform Installer进行安装。 – user888734 2014-02-17 13:28:32
您可能想更新您的答案,因为现在可以在Windows中使用Hadop(https://wiki.apache.org/hadoop/Hadoop2OnWindows)。我很乐意回答,但我仍然在寻找一种方法来使用Mahout :) – fxm 2014-07-31 14:21:46