输入文件包含数千个大小约为10GB的XML格式的事务。需求是根据用户输入选择每个事务XML并将其发送到处理系统。使用StAX和XPath读取巨大的XML文件
文件
<transactions>
<txn id="1">
<name> product 1</name>
<price>29.99</price>
</txn>
<txn id="2">
<name> product 2</name>
<price>59.59</price>
</txn>
</transactions>
的(技术)用户有望给输入的标签名称,如<txn>
的样品含量。
我们希望提供此解决方案以使其更通用。文件内容可能不同,用户可以给出一个XPath表达式,如“//transactions/txn
”来选择单个事务。
有一些技术方面的东西,我们要在这里考虑
- 该文件可以是共享位置或FTP
- 由于文件大小是巨大的,我们不能加载整个文件in JVM
我们可以在这种情况下使用StAX解析器吗?它必须将XPath表达式作为输入并选择/选择事务XML。
寻找建议。提前致谢。
我的建议是使用扩展VTD-XML在MEM地图模式和64位jvm –