2017-06-04 17 views
1

给定一些整数n和日期d,我想使用维基百科API获取nd到当前日期之间的时间内最常见的文章。这是可能的,如果是的话,如何?使用维基百科API在特定时间范围内阅读最多的文章?

我迄今为止尝试如下:

  1. 使用https://wikimedia.org/api/rest_v1/metrics/pageviews/top/en.wikipedia/all-access/2017/05/01。这种方法的问题在于,首先,这似乎不支持除n = 1000之外的其他值,其次,它仅汇总了一天的观看次数,而不是任意的时间范围。

  2. 使用query行动列表allpages(即https://en.wikipedia.org/w/api.php?action=query&format=json&list=allpages)获得的所有文章,但我不知道如何过滤,使得只有最看的文章,包括结果。

我也检查了https://stats.wikimedia.org/,但没有在这里找到有用的东西。

回答

0

目前,此功能似乎无法通过Pageviews API使用。您可以查找给定日期或特定月份中观看次数最多的文章,但不能查看任意时间范围内的文章。有关可用的不同选项,请参阅REST API docs,同时请参阅Pageviews API page on Wikitech,该示例提供了查找给定月份中查看次数最多的文章的示例。 (稍微令人担忧的是,每月查看次数最多的文章似乎没有记录在API文档页面上。)

您还可以通过Action API(api.php)获取浏览量数据,正如Tgr在他下面的评论中所说的,但数据与REST API相同。

您可能想要询问维基媒体开发者观看的wikitech-l email list。他们将能够告诉你这是否可能采取不同的方式,如果不可行,为什么该功能不可用。

+0

浏览量数据可通过[prop = pageviews](https://www.mediawiki.org/w/index.php?title=Extension:PageViewInfo#query+pageviews)/ [list = mostviewed] (https://www.mediawiki.org/w/index.php?title=Extension:PageViewInfo#query+mostviewed)/[meta=siteviews](https://www.mediawiki.org/w/index.php? title = Extension:PageViewInfo#query + siteviews),但它只是REST API数据的补救。 – Tgr

+0

谢谢!在我回答之前,我应该检查那部分内容,因为我调查WMF浏览量已经过去了很长一段时间。我编辑了我的答案,使其更少错误。 :) –