urllib2的结果与网络浏览器的结果不同

我在aws-lambda中写了一个函数。该功能很简单。它只是从特定网站获取请求。urllib2的结果与网络浏览器的结果不同

python2中的Lambda函数如下所示。也包括import urllib2。

def lambda_handler(event, context): 
    # TODO implement 
    url = "https://www.amazon.co.jp/s/field-keywords=4548967337259" 
    response = urllib2.urlopen(url) 
    #print response 

    return response.read()

我把返回值给我ruby on rails服务器，并试图解析了必要的信息。

在网站上，标签和相关信息如下所示。

<a class="a-link-normal a-text-normal" target="_blank" 
rel="noopener" href="https://www.amazon.co.jp/GOTHAM- 
%E3%82%B5%E3%83%BC%E3%83%89-%E3%82%B7%E3%83%BC%E3%82%BA%E3%83%B3- 
%E3%83%96%E3%83%AB%E3%83%BC%E3%83%AC%E3%82%A4- 
%E3%82%B3%E3%83%B3%E3%83%97%E3%83%AA%E3%83%BC%E3%83%88- 
%E3%83%9C%E3%83%83%E3%82%AF%E3%82%B9-Blu-ray/dp/B071K5VZTL/ref=sr_1_1? 
ie=UTF8&amp;qid=1505293516&amp;sr=8-1&amp;keywords=4548967337259">

但是，如果我拿response和使用read()方法来传输，它看起来像这样。

<a class=\"a-link-normal a-text-normal\" target=\"_blank\" rel=\"noopener\" 
href=\"https://www.amazon.co.jp/GOTHAM-%E3%82%B5%E3%83%BC%E3%83%89- 
%E3%82%B7%E3%83%BC%E3%82%BA%E3%83%B3- 
%E3%83%96%E3%83%AB%E3%83%BC%E3%83%AC%E3%82%A4- 
%E3%82%B3%E3%83%B3%E3%83%97%E3%83%AA%E3%83%BC%E3%83%88- 
%E3%83%9C%E3%83%83%E3%82%AF%E3%82%B9-Blu-ray/dp/B071K5VZTL\">

为什么会发生这种情况，我该如何避免这种情况？

其实我想是这样response.json()但无法作出json形式完全。

来源

2017-09-13 jh.shin

尝试传递User-Agent头：

import urllib2 

def lambda_handler(...): 
    request = urllib2.Request("http://www.google.com", 
          headers={"User-Agent" : "Mozilla/5.0"}) 
    return urllib2.urlopen(request).read()

来源

2017-09-13 11:07:53

你能解释一下用头，没有它的区别？ –

@ jh.shin你可以“欺骗”服务器，认为你是一个Web浏览器。没有它似乎它会为您提供不同的内容。 –

您需要通过响应字符串函数：

def lambda_handler(event, context): 
    url = "https://www.amazon.co.jp/s/field-keywords=4548967337259" 
    response = urllib2.urlopen(url) 
    return str(response.read()) #here, casting as a string

来源

2017-09-13 11:22:01 Ajax1234

'response.read（）'和将它转换为一个字符串有什么很大的区别？ –

urllib2的结果与网络浏览器的结果不同

回答

相关问题