我有一个闪存卡制作程序,用于从这里获取信息的西班牙语:http://www.spanishdict.com/examples/zorro(这只是一个示例)。我已经设置好了,所以它的翻译很好,但现在我想添加示例。不过,我注意到,该页面上的示例是动态生成的,所以我安装了Beautiful Soup和HTML5解析器。我对特别感兴趣的标签是:Python - 使用DOM获取HTML
<span class="megaexamples-pair-part">Los perros siguieron el rastro del <span
class="megaexamples-highlight">zorro</span>. </span>
我使用的尝试和检索它的代码是:
soup = BeautifulSoup(urlopen("http://www.spanishdict.com/examples/zorro").read(), 'html5lib')
example = soup.findAll("span", {"class": "megaexamples-pair-part"})
但是,不管什么办法,我摆动它,我可以” t似乎让它拉下动态生成的代码。我已经确认我通过搜索megaexamples-container来获取页面,这很好(你可以通过右键单击google chrome并点击查看页面源代码来查看)。
任何想法?
内容可以由JavaScript加载后产生:
现在你可以用类似解析它。 [检查这个答案。](https://stackoverflow.com/questions/13960567/reading-dynamically-generated-web-pages-using-python) –