-1
我可以采用URL,然后履带遵循每个URL的起始网址的下一页链接及其工作LinkExtractor - 与条件提取
rules = (Rule(LinkExtractor(allow=(), restrict_xpaths=('//a[@class="pagnNext"]',)), callback="parse_start_url", follow= True),)
但是你可以想像我开始在一些获得验证码指向一些网址。我听说可能有蜜罐对人类来说是不可见的,但是在设计的html代码中,可以让你点击以识别你是一个bot。
我要让提取提取链接有条件例如不提取,如果CSS样式显示点击:不存在或类似的东西
是这是可行的
不确定你在问什么 – Umair