我正在学习如何使用scrapy。尤其是使用cookie处理的scrapy。问题是我找不到很多可以帮助我完成这项工作的示例,教程或文档。如果任何人可以提供任何材料,我会非常感激。为了向你展示我是多么迷茫,下面的代码应该表明我缺乏理解;Scrapy和cookie处理
from scrapy.spider import BaseSpider
from scrapy.http.cookies import CookieJar
class sasSpider(BaseSpider):
name = "sas"
allowed_domains = ["sas.no"]
start_urls = []
def parse(self, response):
Request("http://www.sas.no", meta={'cookiejar': response.meta['cookiejar']}, callback = self.nextfunction)
def nextfunction(self, response):
cookieJar = response.meta.setdefault('cookiejar', CookieJar())
cookieJar.extract_cookies(response, response.request)
for cookie in CookieJar:
open('cookies.html', 'wb').write(cookie)
什么是不工作? Scrapy自动处理cookie。 – Blender
@Blender谢谢你看我的帖子!我想手动处理cookie。原因是我想抓取的网站使用javascript来触发GET请求访问我想要抓取的页面所需的cookie。 – Rookie