2016-01-18 62 views
-3

我有一个包含<p>元素和尾部的元素。Python lxml etree从元素中删除尾部

例如:
<p>Content that I want to keep</p>content that I want removed

我注意到,需要被删除的内容在尾部,我认为有一个简单的方法来使用etree元素去掉尾巴。

我将如何做到这一点?

回答

1

经过几个小时的工作后,答案刚刚找到了我。 (当然,在发布后的问题右)

我刚才设置的尾部无:

element = root.xpath("path/to/element") 
element[0].tail = None 
string = tostring(element[0]) 

和它的作品。

-1

使用elementsoup从LXML包:

#!/usr/bin/env python 

from lxml.html.soupparser import fromstring 

s = """<p>Content that I want to keep</p>content that I want removed""" 

print fromstring(s).find('.//p').text