2011-06-06 46 views
0

目前我正在做一些实验,这使得利用维基百科的文章。 维基百科转储文件约为30GB。有工具可用(最好是PHP)或一些脚本,可以将这个整个大文件分成块(每个文章一个xml文件)?分裂维基百科转储文件分成几个XML文件

回答

0

我建议你使用优秀XMLReader,它允许您阅读节点的XML文件的节点,而不是整个文件加载到内存第一。

您仍然可以浏览与DOM或SimpleXML的节点后!