2017-01-19 138 views
0

不知怎的,这似乎并没有工作,总是返回标题字符串空XPath返回空列表

import requests 
from lxml import html 

headers = {'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36'} 
url ='http://www.hayneedle.com/product/discoverngrowjumperoo.cfm' 
page = requests.get(url, headers=headers) 
tree = html.fromstring(page.content) 
title = tree.xpath('//h1[@class="h2 inline"]//text()') 
print(title) 

enter image description here 任何帮助将appreiated,谢谢!

+0

它适合我。 '['Discover-n-Grow Jumperoo']'返回。我在macOS上使用Python 2.7。 –

+0

我在Windows上使用python 3.6,并且它返回这个[],我似乎无法弄清楚什么是错误的 – Dawzer

+0

似乎网站不喜欢被刮。返回的HTML包含验证码。 –

回答

0

我试过用vpn,它实际上工作,好像网站阻止了我原来的ip地址。