-3
我有一个包含<p>
元素和尾部的元素。Python lxml etree从元素中删除尾部
例如:
<p>Content that I want to keep</p>content that I want removed
我注意到,需要被删除的内容在尾部,我认为有一个简单的方法来使用etree元素去掉尾巴。
我将如何做到这一点?
我有一个包含<p>
元素和尾部的元素。Python lxml etree从元素中删除尾部
例如:
<p>Content that I want to keep</p>content that I want removed
我注意到,需要被删除的内容在尾部,我认为有一个简单的方法来使用etree元素去掉尾巴。
我将如何做到这一点?
经过几个小时的工作后,答案刚刚找到了我。 (当然,在发布后的问题右)
我刚才设置的尾部无:
element = root.xpath("path/to/element")
element[0].tail = None
string = tostring(element[0])
和它的作品。
使用elementsoup从LXML包:
#!/usr/bin/env python
from lxml.html.soupparser import fromstring
s = """<p>Content that I want to keep</p>content that I want removed"""
print fromstring(s).find('.//p').text