2017-02-25 48 views
1

我在Ubuntu上安装了一个节点集群。 我想执行wordcount程序。 我已经创建了jar文件。 但是,当我要执行这个命令:运行WordCount时输入路径不存在MapReduce

hadoop jar '/home/hduser/Desktop/TutorialFolder/firstTutorial.jar' WordCount /home/hduser/Desktop/TutorialFolder/input_data /TutorialFolder/Output 

这是给下面的错误:

Exception in thread "main" 
org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist: 
hdfs://localhost:9000/home/hduser/Desktop/TutorialFolder/inp‌​ut_data 
at org.apache.hadoop.mapreduce.lib.input.FileInputFormat.single‌​ThreadedListStatus(F‌​ileInputFormat.java:‌​323) 

回答

1

的输入和输出路径。

传入此处的输入路径/home/hduser/Desktop/TutorialFolder/input_data看起来像本地目录。在HDFS中创建一个类似的结构,并将输入数据上传到HDFS中的该目录。

hdfs dfs -mkdir -p /wordcount/input_data 
hdfs dfs -put /home/hduser/Desktop/TutorialFolder/input_data/ /wordcount/input_data/ 

此外,输出路径必须在HDFS中。 和运行与HDFS路径的罐子,

hadoop jar /home/hduser/Desktop/TutorialFolder/firstTutorial.jar WordCount /wordcount/input_data /wordcount/output 
+0

它的工作表示感谢。我需要通过单击来浏览哪些内容,以查看存储在我知道的hdfs.By命令中的数据。 –

+1

进入'http:// localhost:50070',选择'Utilities - > Browse File System',你应该能够查看在HDFS中创建的文件夹。 – franklinsijo

+0

你能分享你的链接网址吗? –

0

如果你在伪分布式模式运行,输入路径必须存在在HDFS ,其中没有一个桌面文件夹...

运行一些hdfs dfs -ls /home/hduser检查什么是可用的,并且把一些文件有

如果该文件夹不存在,您应该回到教程并设置HDFS。

运行hdfs dfs -mkdir -p /home/hduser

注意:你可能会被拒绝的错误权限与给MapReduce的,除非你是在本地模式下运行的Hadoop必须是有效的HDFS路径是

+0

LS:'/家庭/ hduser /“:没有这样的文件或目录 –

+0

是啊,没错。你的错误不是字数,它没有HDFS设置...所以运行'hdfs dfs -mkdir -p/home/hduser' –

相关问题