2017-05-04 47 views
12

我想知道将documentDB移动到Azure Data Lake Storage的最佳实践是什么。 我应该为集合中的每个文档创建一个文件还是移动整个documentDB? 另外我没有找到关于如何使用U-SQL访问documentDB的很多信息?将DocumentDB集合移动到Azure Data Lake存储

输入将不胜感激。

+0

我想我需要问你为什么要这样做? DocDB和ADL是用于不同目的的不同工具。这是一个永久的举措。或者您是否只想将数据复制到ADL进行报告?如果是这样,是否考虑过在数据湖分析服务中使用表格? –

+0

为了简化它,我有一些发送到ADL的日志文件。我也有一个documentDB包含每个文件的附加信息(不要问我为什么,但这是它的设置)。所以每个日志文件都有一个匹配的documentdb文件。 documentDB作为json文件存储在ADL中。我可以查询json文件,但似乎我不能将它作为documentDB存储,并直接查询(这会更好的索引)。 – reachify

回答

1

您目前无法使用U-SQL访问DocumentDB(或现在称为CosmosDB)中的数据。有一个功能请求here。请随时添加您的投票。

如果您移动数据,组织取决于您希望如何管理数据(删除全部或仅删除部分?),它是如何构建的(将相似的结构化数据保存在一起,无论是在同一个文件或同一文件夹中)以及你如何使用它(总是需要它的所有部分?或者只有部分?)以及什么让你获得最佳的性能(更大的文件通常更好,但如果它们是JSON,也要确保提取过程起作用)。

相关问题