,我想获得忽略响应URL.I只看到在输出控制台这样的:验证失败 - 999- HTTP状态代码不被处理或者使用我不<a href="http://scrapy.org/" rel="nofollow">scrapy</a>允许
DEBUG:忽略响应>:不处理HTTP状态码或不允许。
,我想获得忽略响应URL.I只看到在输出控制台这样的:验证失败 - 999- HTTP状态代码不被处理或者使用我不<a href="http://scrapy.org/" rel="nofollow">scrapy</a>允许
DEBUG:忽略响应>:不处理HTTP状态码或不允许。
根据文档here,您可以添加一个HTTP状态代码列表,这些代码应该由您的蜘蛛处理,即使它们默认情况下不允许。
在你的情况,你必须以下行添加到您的蜘蛛定义:
handle_httpstatus_list = [999]
这将导致蜘蛛得到的结果即使有这样的状态码。
下一次在问一个问题请求通过StackOverflow查找类似的问题并阅读文档。把一些代码告诉我们知道你的错误发生在哪里,这不会是错误的。没有这些信息,社区很少能提供任何答案。
是的,它的作品谢谢@GHajba – Nareshkumar
如果它的工作可以自由接受答案。 – GHajba
@Nareshkumar:请[**接受**](http://meta.stackoverflow.com/q/5234/234215)这个答案,如果它有帮助。谢谢。 – kjhughes
破碎的软件是什么产生的? –