2017-06-22 61 views
0

我试图从List of popular music genres中提取文本维基百科的文章,以便我可以检查看看什么类型的子类。维基百科API,提取文本,包括链接的文本

我发现了一些堆栈溢出链接,描述了如何提取文本,但同时也从页面获取链接文本时遇到困难。

例如:

http://en.wikipedia.org/w/api.php?action=query&format=json&prop=extracts&explaintext&titles=List%20of%20popular%20music%20genres 

会为我提供从页文本,但它不包括任何每个流派中列出的其他风格的。

回答

0

更好地利用MediaWiki API用行动解析:

https://en.wikipedia.org/w/api.php?format=json&action=parse&prop=wikitext&page=List of popular music genres 

除了包括&section=6只为这一部分获取内容:

https://en.wikipedia.org/w/api.php?format=json&action=parse&prop=wikitext&page=List of popular music genres&section=6