2013-04-21 72 views
1

我试图在Eclipse上运行字数统计示例。通常当我们点击eclipse中的“在hadoop上运行”选项时,我们会得到一个新窗口,要求选择服务器位置。但是,现在它直接运行程序,而不要求我从下面的列表中选择现有的服务器。Hadoop WordCount示例 - 在Hadoop(Eclipse)上运行选项不提示选择Hadoop服务器在窗口上运行

我想因为这个我收到以下异常:

FileInputFormat.setInputPaths(conf, "/home/hduser1/gutenbergIP/pg4300.txt"); 

到:

FileInputFormat.setInputPaths(conf, "hdfs://localhost:54310/home/hduser1/gutenbergIP/pg4300.txt"); 

如果,如果我更改从线

13/04/21 08:46:31 ERROR security.UserGroupInformation: PriviledgedActionException as:hduser1 cause:org.apache.hadoop.mapred.InvalidInputException: Input path does not exist: file:/home/hduser1/gutenbergIP/pg4300.txt 
Exception in thread "main" org.apache.hadoop.mapred.InvalidInputException: Input path does not exist: file:/home/hduser1/gutenbergIP/pg4300.txt 

我的代码工作我明确指定了正在工作的完整网址的文件名。我想要一些帮助。我如何让我的亲戚网址工作,而不是提供完整的网址(必须将此作为学校作业提交)。

回答

0

添加以下两行代码中的:

config.addResource(new Path("/HADOOP_HOME/conf/core-site.xml")); 
config.addResource(new Path("/HADOOP_HOME/conf/hdfs-site.xml")); 

如果不指定该客户会考虑当地的FS,不包含在指定的路径,因此抛出这个错误。

+0

谢谢@Tariq,它像一个魅力工作! – 2013-04-21 17:27:30