2016-07-11 80 views
1

我需要知道导致同一个项目的Wikipedia文章URL的所有不同URL。例如:获取重定向到维基百科页面的所有URL的列表?

https://en.wikipedia.org/wiki/Lucite

重定向到最终网址:

https://en.wikipedia.org/wiki/Poly(methyl_methacrylate)

但是,我不知道有多少其他的网址也重定向到该页面的URL最终,这个时代问题的每一个维基百科文章。是否有特定的API调用我没有看到您可以发送最终的page_name/URL,并且它返回了重定向到最终URL的所有名称/ URL的JSON?如果存在,我真的需要这样的东西。作为参考,我已经看到了,我知道的事实,你可以像这样所有页面进行两个API调用:

https://en.wikipedia.org/w/api.php?action=query&generator=allpages&format=json&gaplimit=500&gapfilterredir=nonredirects

,然后将其重定向nonfiltering的一个

https://en.wikipedia.org/w/api.php?action=query&generator=allpages&format=json&gaplimit=500&

我知道你可以把这两组不相交,这些都是重定向URL,并且你可以在所有页面上无限次地做到这一点,并找到所有重定向的名称/ URL,但它可以节省我在我的项目指数时间,如果我可以简单地找到一种方法发送一个URL到Wikipei dia的API,并以某种方式获取所有导致返回到最终页面URL的URL列表。先谢谢你!

+1

请注意,虽然你可以得到*页面的列表*其重定向到指定页面,* URL列表*重定向有由于URL标准化而变得无限。例如,“Lucite”,“Lucite_”和“Lucite__”都会重定向到同一个地方。 – Tgr

+0

正式注意谢谢。值得庆幸的是,我只需要在维基百科上直接映射重定向,就像下面的答案一样,因为我想确保所有可能的hrefs都存储在特定页面中,因为这样我就不会计算每个维基百科文章中有多少“内部反向链接”在整个维基百科本身都有。 – EazyC

回答

相关问题