2017-05-05 58 views

回答

2

假设你已经在CSV文件中的S3桶CSV文件和一行将被插入作为一个单独的XML记录......这不是你的问题清楚,但最常见的情况。如果你的计划是只拉中的文件,并坚持他们作为CSV文件,也有可能被用来访问S3存储和拉断中的文件无证XQuery函数。无论如何,MLCP文件对于理解这个非常灵活和强大的工具非常有帮助。

根据文档(https://developer.marklogic.com/products/mlcp)支持的数据来源是:

  • 本地文件系统
  • HDFS
  • MarkLogic存档
  • 另一个MarkLogic数据库

您可能挂载S3 Bucket将EC2上的本地文件系统绕过需要制作的f MLCP可以访问。如果这很重要,Google就是你的朋友。我个人还没有看到过生产稳定的方法,但是我尝试了很长时间。

无论如何,你需要提供这些文件所支持的来源,最有可能是文件系统位置在这种情况下,如果MLCP可以运行,可以达到的文件。我想这就是你将这些文件放在某处的意思。 MLCP可以在导入模式下处理分隔文件。该文档对于理解所有选项非常有用。