1
我想保持windows azure hdinsight群集始终运行,以便我可以定期从我的主数据存储(即mongodb)写入更新并让它处理map-reduce作业一经请求。如何将mongodb数据连续写入正在运行的hdinsight群集
如何定期将数据从mongodb与hdinsight服务同步?我试图不必上传全部数据,无论何时提交新的查询,而是以某种方式预先加热。
hdinsight可能吗? Hadoop甚至有可能吗? 谢谢,
我应该为10gen维护一个[hadoop的mongodb连接器](http://docs.mongodb.org/ecosystem/tools/hadoop/),但我不能将它安装在hdinsight(它是一个托管服务) –