2014-03-04 65 views
2

我们如何在xpath中遍历回父节点?使用lxml.html.xpath遍历回父节点

我爬IMDB,获得电影流派,我使用

elem = hxs.xpath('//*[@id="titleStoryLine"]/div/h4[text()="Genres:"]')

现在,流派被列为锚链接,这是兄弟这个标签。这怎么能实现呢?

回答

2

这将选择你给XPath表达式的父元素:

//*[@id="titleStoryLine"]/div/h4[text()="Genres:"]/..

2

对于LXML 内置的ElementTree),父是在元素中。你可以这样得到它:

parent = elem.getparent() 

然后从那里寻找任何你需要的东西。