我完全难住为什么lxml .text
会给我一个儿童标签的文本,但为根标签。如何使用lxml获取根元素的文本?
some_tag = etree.fromstring('<some_tag class="abc"><strong>Hello</strong> World</some_tag>')
some_tag.find("strong")
Out[195]: <Element strong at 0x7427d00>
some_tag.find("strong").text
Out[196]: 'Hello'
some_tag
Out[197]: <Element some_tag at 0x7bee508>
some_tag.text
some_tag.find("strong").text
返回<strong>
标签之间的文本。
我希望some_tag.text
返回<some_tag> ... </some_tag>
:
<strong>Hello</strong> World
相反,它没有返回。
我试过了minidom,但似乎也没有工作。 'some_tag_md = minidom。parseString( '你好世界 ')' 'some_tag_md.nodeValue' :/ –
2012-04-21 12:43:02