2017-03-18 36 views
1

我试图从维基百科页面的每个文字内容包括使用API​​沙箱上Ballon_d'Or维基百科页面表中提取。如何通过API提取维基百科页面WikiTables?

我试着给定的查询:

https://en.wikipedia.org/w/api.php?action=query&format=json&prop=extracts&titles=Ballon_d%27Or&explaintext=1&exsectionformat=wiki 

,但它为我提供了唯一的文本内容,而不从维基表像这样的内容:

enter image description here

有没有一种方法,我可以得到已被获得与文本信息以及文本格式的表格内容?

或者,我可以用美丽的汤尝试网页抓取技术,但我想寻找的查询方法,先。

+1

不,你必须使用某种HTML解析器。 – Tgr

回答