假如我有一个HTML字符串是这样的:如何使用Python中的BeautifulSoup提取标签内的文本?
<html>
<div id="d1">
Text 1
</div>
<div id="d2">
Text 2
<a href="http://my.url/">a url</a>
Text 2 continue
</div>
<div id="d3">
Text 3
</div>
</html>
我想提取的d2
的内容,不其他标签包裹,跳过a url
。换句话说,我想得到这样的结果:
Text 2
Text 2 continue
有没有办法用BeautifulSoup做到这一点?
我尝试这样做,但它是不正确的:
soup = BeautifulSoup(html_doc, 'html.parser')
s = soup.find(id='d2').text
print(s)