2011-04-13 40 views
0

我需要维基百科的我的国家的城市页面在我的网站上使用。 例如New York会有一个关于城市的主页。所以如果我有一个城市的列表,我该如何下载页面?
如何从维基百科使用脚本复制页面?

这将是1000年的城市。

我也听说维基百科不喜欢漫游器访问它的页面。 我将根据Creative Commons许可证使用这些信息。

如果我能够在perl脚本中编写代码,那会很好。

回答

5

时,他们所提供的数据可自由下载你不应该凑百科:

http://en.wikipedia.org/wiki/Wikipedia:Database_download

以及如何使用它的提示:

http://en.wikipedia.org/wiki/Wikipedia:Database_download#Help_parsing_dumps_for_use_in_scripts

然后,你可以简单地使用已经提供给您的工具:

http://search.cpan.org/dist/MediaWiki-DumpFile

或者,如果你真的想只是一个已知的,有限的子集,有可用的API:

http://www.mediawiki.org/wiki/API

要使用Perl的你会开始看LWP和JSON模块,或者,还可以利用CPAN:http://search.cpan.org/dist/MediaWiki-API

+0

同样的'特别:Export'页。 – icktoofay 2011-04-13 06:12:11

+0

这记录在http://www.mediawiki.org/wiki/Manual:Parameters_to_Special:Export。 – daxim 2011-04-13 09:07:43