5
BeautifulSoup
,.text
和.get_text()
之间是否有区别?.text和.get_text之间的区别()
哪一个应该是首选获取元素的文本?
>>> from bs4 import BeautifulSoup
>>>
>>> html = "<div>text1 <span>text2</span><div>"
>>> soup = BeautifulSoup(html, "html.parser")
>>> div = soup.div
>>> div.text
'text1 text2'
>>> div.get_text()
'text1 text2'
基本上你可以使用'get_text()'使用自定义分隔符,你应该使用它作为'.text'是一个私有属性,甚至没有记录。 – Selcuk
@Selcuk是的,我个人一直使用'get_text()'主要是因为它明确记录了,但我看到很多bs4用户直接使用'.text'并对这个缺点感到好奇。谢谢! – alecxe
嗯......那么'div.string'是什么? –