1
我试图从维基百科页面的每个文字内容包括使用API沙箱上Ballon_d'Or维基百科页面表中提取。如何通过API提取维基百科页面WikiTables?
我试着给定的查询:
https://en.wikipedia.org/w/api.php?action=query&format=json&prop=extracts&titles=Ballon_d%27Or&explaintext=1&exsectionformat=wiki
,但它为我提供了唯一的文本内容,而不从维基表像这样的内容:
有没有一种方法,我可以得到已被获得与文本信息以及文本格式的表格内容?
或者,我可以用美丽的汤尝试网页抓取技术,但我想寻找的查询方法,先。
不,你必须使用某种HTML解析器。 – Tgr