我试图从维基百科页面中提取内部链接。这是我正在使用的查询如何从维基百科页面的最新版本获取内部链接?
/w/api.php?action=query&prop=links&format=xml&plnamespace=0&pllimit=max&titles=pageTitle
但是,结果并不反映维基页面上的内容。以一个随机文章here为例。此页面上只有十几个链接。但是,当我作出查询时,
/w/api.php?action=query&prop=links&format=xml&plnamespace=0&pllimit=max&titles=Von_Mises%E2%80%93Fisher_distribution
我找回了187个链接。我猜这个API可能有一个包含所有修改的页面的所有链接的数据库。是这样吗?我如何才能从最后一次修订中获得链接?
难道是你忘了导航盒中的链接?从我可以看到API回复的所有链接都在页面中。你能举一个不应该在那里的链接的例子吗? – leo
+1。你说得对,利奥。不幸的是,这个API不允许我指定页面的哪一部分从( – chepukha