我的工作,需要存储用于处理大量2GB + XML文件的应用程序,并且我面临两个问题:用Heroku存储和处理大型XML文件?
- 如何处理该文件?一次将整个文件加载到Nokogiri中将不起作用。它很快消耗了记忆,据我所知,这个过程从轨道上消失。是否有与Heroku兼容的方法来以较小的块快速/轻松地读取位于非Heroku服务器上的大型XML文件?
- 如何存储文件?该网站设置为使用S3,但数据提供商需要通过FTP访问每晚上传XML文件。通过FTP的S3显然是不可行的,并且将文件存储在Heroku上也不起作用,因为它只会被拥有它的测试仪看到,并且容易被随机清除。有没有人遇到过这种类型的约束,如果是的话,你是怎么解决它的?
使用扩展的VTD-XML,您可以在xml文件(最大256GB)上执行xpath(全集)。 –