2011-08-17 64 views
1

我正在尝试从维基百科获取音乐艺术家图片和专辑封面的艺术信息。有没有人试过这个? 我四处搜寻,发现相关信息几个环节从维基百科下载音乐类别和处理更新的图片

http://commons.wikimedia.org/w/index.php?title=Special:Search&ns0=1&ns6=1&ns12=1&ns14=1&ns100=1&ns106=1&redirs=0&search=buitenzorg&limit=10&offset=0 - 为buitenzorg搜索图片

http://www.mediawiki.org/wiki/API:Allimages - 所有图像API调用来从维基

获取图像的URL,但无法找到一个方法来下载所有来自Music类别的图像并在初始下载后运行增量更新。任何指向解决方案的指针都会有所帮助。

回答

2

我到处搜索,最后我去了下面提到的实现。 这里的API文档:http://www.mediawiki.org/wiki/API:Main_page

  1. 呼叫维基百科的API艺术家页面
  2. 看右边给选手卡信息,并获取图像的名称。
  3. 进行另一个维基媒体调用以获取图像下载网址。
  4. 下载实际图像。

对于deltas,唯一的方法是再次用wiki图片名称命中wikipedia API并检查更新。

另一个解决方法是设置你自己的维基媒体服务器,它将处理增量。

请看这里http://www.mediawiki.org/wiki/Manual:Installation_guide

+0

你是怎么做的#3? – Ferdy

+0

我使用了来自#2调用的IMAGE_TITLE的API调用http://en.wikipedia.org/w/api.php?action=query&prop=imageinfo&iiprop=url&format=xml&titles= 。 – param