2008-11-17 28 views
10

目前我有两个MediaWikis,一个比另一个稍旧。我想将两者的内容合并在一起,而不会消除重复的页面。到目前为止,我能想到的最好的选择是使用bot(如pywikipedia)遍历一个wiki的所有页面,并尝试将它们插入另一个wiki,重命名重复的页面。将MediaWiki内容合并到一起

该解决方案似乎需要一段时间才能完成。有没有更好的方法来做到这一点,我只是不知道?我并没有直接与MediaWiki数据库直接合作过,所以我不知道自己在做什么,所以我不能很好地处理它。

回答

8

MediaWiki有importexport功能,您可以使用它来移动内容。它会合并现有页面的历史记录(请参阅导入链接)。

但是,它不处理具有相同名称的两个不同页面的冲突,因此您必须自己处理移动页面。就我在MediaWiki page table的描述中可以看到的,你可以直接在SQL中查找和重命名重复页面,但是pywikipedia也可以工作(但是你需要删除由“正确”页面移动导致的重定向,否则他们会搞乱从其他wiki导入的页面)。

+0

我同意 - 除非将有几百个重复页面,否则我建议使用XML导入/导出功能。 – HanClinto 2008-11-17 15:17:16