1
我试图解析HTML的片段是这样的:解析HTML在美丽的汤
<div><span>adrress</span>text of address</div>
我如何可以采取分段“地址的文本”编程没有Beatiful汤span标记?
现在我把DIV的全部内容,并删除跨度,但我觉得有一个更好的办法
我试图解析HTML的片段是这样的:解析HTML在美丽的汤
<div><span>adrress</span>text of address</div>
我如何可以采取分段“地址的文本”编程没有Beatiful汤span标记?
现在我把DIV的全部内容,并删除跨度,但我觉得有一个更好的办法
>>> fragment = '<div><span>adrress</span>text of address</div>'
>>> soup = BeautifulSoup(fragment)
>>> soup.div.span.nextSibling
u'text of address'
方法如下:
>>> from BeautifulSoup import BeautifulSoup
>>> text = "<div><span>address</span>text of address</div>"
>>> print BeautifulSoup(text).find('div').contents[-1]
text of address
对不起,我的第一个答案,我误解了问题。
是否可以使用正则表达式? – tanaydin
@tanaydin正则表达式和html不会放在一起。 – kingdamian42