2013-04-24 196 views
2

我有这段代码从网页读取链接(URL)并将它们打印在屏幕上。从dom.xpath获取img src

connection = urllib.urlopen("http://www.google.com") 
dom = lxml.html.fromstring(connection.read()) 
for link in dom.xpath('//a/@href'): 
    print link 

它工作正常。
现在我想要做的完全一样的东西,但代替URL的锚定标记a我想要得到的图像在 src下的HTML标记的网址。我无法理解dom.xpath('//a/@href')是如何工作的。如果有人能够解释它或只是引导我参加一个教程,那就太好了。
干杯

回答

3

有关xpath的开头,请查看http:wiki/XPath或了解有关USING XPATHS的更多信息。 (<a>标签)。

对于所有图像src属性,这将是//img/@src

+0

非常感谢你 – Leonidus 2013-04-25 04:31:24