2012-10-02 64 views
2

嗨我想在hadoop安装的服务器上运行hadoop,但我不知道hadoop所在的目录。服务器由服务器管理员配置。HADOOP_HOME和hadoop streaming

为了加载hadoop,我使用dotkit包中的use命令。

可能有几种解决方案,但希望知道hadoop软件包的安装位置,如何设置$ HADOOP_HOME变量以及如何approp运行hadoop流式作业,例如$ HADOOP_HOME/bin/hadoop jar $ HADOOP_HOME /mapred/contrib/streaming/hadoop-streaming.jar,又名,http://wiki.apache.org/hadoop/HadoopStreaming

谢谢!任何帮助将不胜感激!

回答

9

如果您使用的是cloudera发行版,那么它很可能是/usr/lib/hadoop,否则它可能在任何地方(由您的系统管理员决定)。

有一些技巧,你可以用它来尝试并找到它:

  1. locate hadoop-env.sh(假设查找已安装并updatedb的最近已运行)如果你在运行这个机器
  2. 正在运行hadoop服务(如数据节点,作业跟踪器,任务跟踪器,名称节点),则可以执行hadoop命令的进程列表和grep:ps axww | grep hadoop
  3. 如果没有上述两项,请查找hadoop根目录在一些常见的位置,如:/usr/lib/usr/local/opt
  4. 做不到这一切,并假设当前用户有权限:find/-name hadoop-env.sh
+0

谢谢克里斯,所有设置;-) – Dnaiel

-4

你为什么不尝试:

echo $HADOOP_HOME

Obiviously上述环境变量必须是在您甚至可以从盒子上的任何地方发出hadoop可执行文件之前设置。

0

如果您使用rpm进行安装,那么它最有可能是/etc/hadoop