我遇到一个问题,它可能很容易,但我没有在文档中看到它。Python BeautifulSoup只选择顶部标签
这里是目标html结构,非常简单。
<h3>Top
<em>Mid</em>
<span>Down</span>
</h3>
我想这是h3
标签内的“顶”的文字,我写这个
from bs4 import BeautifulSoup
html ="<h3>Top <em>Mid </em><span>Down</span></h3>"
soup = BeautifulSoup(html)
print soup.select("h3")[0].text
但它会返回Top Mid Down
,我怎么修改呢?
谢谢,我会检查更多关于'contents'和'children'的细节 –