我想从一个网页(链接下面)使用请求在Python中获取一些信息;然而,当我通过python的请求库进行连接时,我在浏览器中看到的HTML数据似乎并不存在。没有一个xpath查询返回任何信息。我能够使用其他网站的请求,如亚马逊(下面的网站实际上由亚马逊拥有,但我似乎无法从中获取任何信息)。使用Python请求库删除网页
url = 'http://www.myhabit.com/#page=d&dept=men&asin=B00R5TK3SS&cAsin=B00DNNZIIK&qid=aps-0QRWKNQG094M3PZKX5ST-1429238272673&sindex=0&discovery=search&ref=qd_men_sr_1_0'
user_agent = {'User-agent': 'Mozilla/5.0'}
page = requests.get(url, headers=user_agent)
tree = html.fromstring(page.text)
query = tree.xpath("//span[@id=ourPrice]/text()")
您的'url'不在引号内,因此它不是字符串。 – MattDMo
它似乎在使用javascript和ajax加载产品说明。 – user3557327
事实上,几乎所有的网站内容都是在javascript XHR调用下构建的。 – felipsmartins