我需要维基百科的我的国家的城市页面在我的网站上使用。 例如New York会有一个关于城市的主页。所以如果我有一个城市的列表,我该如何下载页面?
如何从维基百科使用脚本复制页面?
这将是1000年的城市。
我也听说维基百科不喜欢漫游器访问它的页面。 我将根据Creative Commons许可证使用这些信息。
如果我能够在perl脚本中编写代码,那会很好。
我需要维基百科的我的国家的城市页面在我的网站上使用。 例如New York会有一个关于城市的主页。所以如果我有一个城市的列表,我该如何下载页面?
如何从维基百科使用脚本复制页面?
这将是1000年的城市。
我也听说维基百科不喜欢漫游器访问它的页面。 我将根据Creative Commons许可证使用这些信息。
如果我能够在perl脚本中编写代码,那会很好。
你可以使用WWW::Wikipedia
:
#!/usr/bin/env perl
use strict;
use warnings;
use WWW::Wikipedia;
my $wiki = WWW::Wikipedia->new();
my $entry = $wiki->search('New York');
binmode STDOUT, ':utf8';
print $entry->fulltext();
读阿布牛逼文本返回方法WWW::Wikipedia::Entry
:
时,他们所提供的数据可自由下载你不应该凑百科:
http://en.wikipedia.org/wiki/Wikipedia:Database_download
以及如何使用它的提示:
http://en.wikipedia.org/wiki/Wikipedia:Database_download#Help_parsing_dumps_for_use_in_scripts
然后,你可以简单地使用已经提供给您的工具:
http://search.cpan.org/dist/MediaWiki-DumpFile
或者,如果你真的想只是一个已知的,有限的子集,有可用的API:
http://www.mediawiki.org/wiki/API
要使用Perl的你会开始看LWP和JSON模块,或者,还可以利用CPAN:http://search.cpan.org/dist/MediaWiki-API
同样的'特别:Export'页。 – icktoofay 2011-04-13 06:12:11
这记录在http://www.mediawiki.org/wiki/Manual:Parameters_to_Special:Export。 – daxim 2011-04-13 09:07:43