2012-09-25 66 views
0

我是Hadoop的新手,并试图在数据仓库和分析方面学习它。设置Hadoop数据仓库环境(Hive)

有人能告诉我如何设置我的做法的机器,尤其是开始学习 2.Is它建议在Windows上设置所需的关于机器/节点的 1.Number? 3.需要安装什么软件 4.测试/样本数据的可用性

另外我想获得有关使用Hive执行BI操作的最佳方法的建议。

谢谢。

回答

0

我建议下载cloudera虚拟机,如果你更感兴趣的hadoop机械。另一种快速启动的方式 - 使用亚马逊EMR(弹性地图缩小)。有一个选项可以在那里创建交互式配置单元集群,并开始播放存储在S3中的数据集。
关于节点的数量 - 取决于目标。如果你有兴趣“感受”一些hadoop性能 - 尝试至少4-6节点。
如果您无权访问组织的内部hadoop/hive群集,上面列出的两种方法都很好。即使在这种情况下 - 我建议在使用共享环境之前尝试与他们取得一些动手。