0
我使用的是Ubuntu 13.04。 我下载了英文维基百科转储。 .xml.bz2
文件大约9Gb。在我使用命令行工具提取它之后,我得到一个大小为44Gb的.xml文件。我无法找到合适的方法来读取xml文件的内容。任何关于如何去做同样的建议。我试过this。我已经使用文章中所述的方法安装了wikidump。文章提到了我找不到的wikidump.cfg
文件。另外如何在定位文件后继续进行。 我对Linux的工作环境比较陌生。任何帮助赞赏。解析维基百科转储(.xml文件)
目标是什么,你为什么下载完整的转储? – frlan