我对hadoop和hbase非常陌生,并且在我找到的每个教程中都有一些概念性问题让我失望。将csv数据加载到Hbase
我有我的win 7系统上的Ubuntu VM中的单个节点上运行hadoop和hbase。我有一个我想加载到单个hbase表的csv文件。
的列有:loan_number,borrower_name,current_distribution_date,loan_amount
我知道,我需要写一个MapReduce工作这一说csv文件加载到HBase的。以下教程描述编写此MapReduce作业所需的Java。 http://salsahpc.indiana.edu/ScienceCloud/hbase_hands_on_1.htm
什么我缺少的是:
我在哪里保存这些文件,我在哪里编译它们?我应该在运行visual studio 12的win 7机器上编译这个文件,然后将其移至ubuntu vm?
我读这太问题和答案,但我想我还缺少基础:Loading CSV File into Hbase table using MapReduce
我无法找到任何东西覆盖了这些基本的Hadoop/HBase的物流。任何帮助将不胜感激。
谢谢!我一定会去探索这些选择。 – bjoern