2
我在s3(50GB)上有一个很大的xml文件。我想将此文件流式传输到sax xml解析器,以便使用ruby进一步处理。我如何在一个环境中做到这一点,我可以在本地下载整个文件,但只能通过tcp从s3流式传输它?Sax从S3解析大文件
我在考虑使用https://github.com/ohler55/ox解析它自己,而https://github.com/aws/aws-sdk-ruby用于访问S3上的文件。我只是不确定如何使用流式方法连接这些部分?
https://amolnpujari.wordpress.com/2012/03/31/reading_huge_xml-rb/ –