我们如何在xpath中遍历回父节点?使用lxml.html.xpath遍历回父节点
我爬IMDB,获得电影流派,我使用
elem = hxs.xpath('//*[@id="titleStoryLine"]/div/h4[text()="Genres:"]')
现在,流派被列为锚链接,这是兄弟这个标签。这怎么能实现呢?
我们如何在xpath中遍历回父节点?使用lxml.html.xpath遍历回父节点
我爬IMDB,获得电影流派,我使用
elem = hxs.xpath('//*[@id="titleStoryLine"]/div/h4[text()="Genres:"]')
现在,流派被列为锚链接,这是兄弟这个标签。这怎么能实现呢?
这将选择你给XPath表达式的父元素:
//*[@id="titleStoryLine"]/div/h4[text()="Genres:"]/..
对于LXML 仅(不内置的ElementTree),父是在元素中。你可以这样得到它:
parent = elem.getparent()
然后从那里寻找任何你需要的东西。