我对Hadoop分布式文件系统的设置以及我的特定设置如何影响它有点困惑。我使用本指南在Virtual Box上使用两台虚拟机来设置它http://www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-multi-node-cluster/,并运行该示例(只是使用txt文件输入的简单字数)。到目前为止,我知道datanode管理和检索节点上的文件,而tasktracker分析数据。Hadoop DFS的CopyFromLocal命令如何工作?
1)当你使用命令-copyFromLocal,你是复制文件/输入到HDFS? Hadoop是否知道如何划分从站/主站之间的信息,它是如何实现的?
2)在上面链接指南中概述的配置中,技术上有两个从站(主站作为主站和从站)?这是常见的还是主机通常只给jobtracker/namenode任务?