2016-04-13 43 views
1

我正在寻找将大量XML文件导入SQL Azure表的体系结构元素和准则。Azure体系结构可将大量XML文件可靠地导入Azure SQL表

下面是XML文件格式和输入的特性:

  • 的XML文件并不大。
  • XML文件的模式非常简单且定义明确。
  • 有大量XML文件被 复制到每个 小时的BLOB存储中。

我曾希望将Azure Stream Analytics与BLOB存储输入作为一个完美的解决方案。然而,Azure中的分析数据不支持XML格式:(

我很清楚地知道SSIS的选择;然而,SSIS是一个IaaS和我期待的基于Azure的PaaS的选项

什么是我的天青的PaaS。架构选项?

回答

0

你不能直接写入SQL DB吗? SQL DB中的XML数据类型功能应该足以执行解析。这提供了一些示例代码:http://www.sqlserver.info/syntax/parse-xml-with-sql-server/

如果您不控制Blob存储区的上游,则不会控制跟踪更改并将数据泵入SQL DB的几个选项。最简单的可能只是一个Web Blob绑定到Blob:这应该让你开始:https://github.com/Azure/azure-webjobs-sdk-samples/tree/master/BasicSamples/BlobOperations HTH仍然有一点延迟。

1

推荐的解决方案是,使用Azure的数据工厂来执行之前通过流分析摄取的数据转换,尽管数据工厂会很乐意将数据直接发送到SQL表了。

有一个好博客文章Solving the “big legacy data” problem using Azure Data Factory…说明了一切。

+0

谢谢@Michael ADF中的触发机制是什么?我需要尽快处理XML文件上传到BLOB。 SA很好地扫描blob存储,获取新的XML文件并处理它们。 ADF能否类似地监视blob以获取新文件? –