Azure HDInsight群集每隔几天(由Microsoft随机?)重新启动,并且在此过程中,对hive-site.xml的任何自定义更改(如添加JsonSerde)都会丢失,而没有任何预先警告,因此Excel/PowerPivot的配置单元查询开始中断。HDInsight持久性Hive设置
你应该如何处理这种情况 - 我们是否被迫将我们的数据存储为CSV文件?
Azure HDInsight群集每隔几天(由Microsoft随机?)重新启动,并且在此过程中,对hive-site.xml的任何自定义更改(如添加JsonSerde)都会丢失,而没有任何预先警告,因此Excel/PowerPivot的配置单元查询开始中断。HDInsight持久性Hive设置
你应该如何处理这种情况 - 我们是否被迫将我们的数据存储为CSV文件?
如果在群集创建时指定Hive config参数和自定义配置对象,它应该保留。这里的链接http://hadoopsdk.codeplex.com/wikipage?title=PowerShell%20Cmdlets%20for%20Cluster%20Management有关于使用自定义配置创建群集的更多详细信息。
为了在操作系统更新或节点重新映像期间保留自定义,您应该考虑使用脚本操作。这里是链接:http://azure.microsoft.com/en-us/documentation/articles/hdinsight-hadoop-customize-cluster/
这在MSDN博客中具有显示哪些自定义选项通过不同的方法,以及使用PowerShell的或SDK来创建自定义的配置单元的配置参数集群实例支撑的工作台(62号线在Powershell示例中为-64):http://blogs.msdn.com/b/bigdatasupport/archive/2014/04/15/customizing-hdinsight-cluster-provisioning-via-powershell-and-net-sdk.aspx
这是持续这些设置的唯一方法,因为群集节点可以针对Azure服务事件(例如安全更新)进行重置,并且在此时将配置设置回初始值发生。