2015-11-11 51 views
10

我下载德国Wikipedia转储dewiki-20151102-页面,文章,multistream.xml。我的简短问题是:在这种情况下,“多流”意味着什么?多数据转储维基百科

回答

11

转储使用bz2压缩的,BZ2支持并行版本允许它压缩/解压缩速度更快的文件。使用并行版本 压缩的数据被标记为multistream

了解这些信息有差别,当你正在处理从一种编程语言转储,因为你必须通过一个标志来告诉库如何解压缩(平行或非平行)。

+0

可否请你回答这个问题: https://stackoverflow.com/questions/48386791/extract-related-articles-in-different-languages-using-wikidata-toolkit?noredirect=1#comment84061677_48386791 – SahelSoft