0
不知怎的,这似乎并没有工作,总是返回标题字符串空XPath返回空列表
import requests
from lxml import html
headers = {'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36'}
url ='http://www.hayneedle.com/product/discoverngrowjumperoo.cfm'
page = requests.get(url, headers=headers)
tree = html.fromstring(page.content)
title = tree.xpath('//h1[@class="h2 inline"]//text()')
print(title)
它适合我。 '['Discover-n-Grow Jumperoo']'返回。我在macOS上使用Python 2.7。 –
我在Windows上使用python 3.6,并且它返回这个[],我似乎无法弄清楚什么是错误的 – Dawzer
似乎网站不喜欢被刮。返回的HTML包含验证码。 –