新手的蟒蛇,想使用LXML +的XPath从网页中获取视频链接,我现在拥有的是:使用python lxml + xpath从页面获取视频,获取列表但无法打印出结果?
import urllib2
from lxml import etree
url=u"http://hkdramas.se/fashion-war-%E6%BD%AE%E6%B5%81%E6%95%99%E4%B8%BB-episode-20/"
xpath=u"//script[contains(.,'label:\"360p\"')]"
html=urllib2.urlopen(url).read()
selector=etree.HTML(html)
get=selector.xpath(xpath)
print get
我已经checke的get
type()
,这说明我是一个list
,但是当我print get
,它显示我意想不到的[<Element script at 0x2a34b88>]
,这是什么意思?以及如何提取视频的实际url而不是Element script
?
终于,我得到了,为什么我有这个问题,谢谢@unutbu
xpath=u"//script[contains(.,'label:\"360p\"')]"
应该
xpath=u"//script[contains(.,'label:\"360p\"')]//text()"
其中新增text()
以确保回报只有文字,而不是元素,在选择元素下,请注意//
,以便在选择中有许多子元素时兼容。
感谢快速和详细的答复,虽然我不熟悉的're'模块,我想我可以赶上这个。但是xpath的解释部分非常有用,谢谢。我会把我的解决方案放在OP上。 – anyone