2013-08-23 20 views
2

我想以易于报告的格式将映射缩减器生成的数据保存到hdinsight中。理想情况下表结构(Azure表存储)。经过一番研究,看起来HDInsight服务只能用于Azure存储库(ASV)(包括读取和写入)。那是对的吗?HDInsight是否仅适用于ASV(blob存储)?

我宁愿在C#中实现hdinsight映射器/缩减器。

我对蜂房或猪的了解不多,想知道是否有一种功能可以在ASV以外的外部(天蓝色表格)数据存储中保留还原剂结果?

回答

1

目前支持HDInsight的默认存储是ASV。您还可以将数据存储在HDInsight群集上的“本地”HDFS文件系统上。但是,这意味着让群集永久运行,并将您限制在计算节点上的存储中。这可能会非常昂贵。

一个解决方案可能会根据大小以及您计划对其执行的操作将结果逐步转换为SQL服务器(或SQL Azure)。

或者,我目前正在研究一个connector between Hive and Azure Tables,它目前允许您从Azure表读入Hive(通过外部表),但是很快也会获得写入支持。

+0

感谢您证明我的假设。我会优先考虑不将数据存储在HDInsight“本地”高清上。我也会研究sqoop,但最有可能会坚持使用ASV,并在处理数据报告之前处理Azure中的斑点,因为最重要的工作将由map/reducer执行,并且使用hadoop的优点是没有意义的。 – Paul

相关问题