Scrapy指出没有页面/项目已被抓取？

我的蜘蛛目前正在从网站上抓取一个xml。这样做是成功的，因为我可以看到通过数据库管道存储的项目。Scrapy指出没有页面/项目已被抓取？

但是，当我查看日志（设置为log.INFO）时，它表示没有任何内容被抓取？

2013-04-12 11:58:00-0400 [traffics] INFO: Spider opened 
2013-04-12 11:58:00-0400 [traffics] INFO: Crawled 0 pages (at 0 pages/min), scraped 0 items (at 0 items/min) 
2013-04-12 11:58:03-0400 [traffics] INFO: Closing spider (finished) 
2013-04-12 11:58:03-0400 [traffics] INFO: Dumping Scrapy stats: 
    {'downloader/request_bytes': 273, 
    'downloader/request_count': 1, 
    'downloader/request_method_count/GET': 1, 
    'downloader/response_bytes': 28883, 
    'downloader/response_count': 1, 
    'downloader/response_status_count/200': 1, 
    'finish_reason': 'finished', 
    'finish_time': datetime.datetime(2013, 4, 12, 15, 58, 3, 469842), 
    'log_count/DEBUG': 7, 
    'log_count/INFO': 4, 
    'response_received_count': 1, 
    'scheduler/dequeued': 1, 
    'scheduler/dequeued/memory': 1, 
    'scheduler/enqueued': 1, 
    'scheduler/enqueued/memory': 1, 
    'start_time': datetime.datetime(2013, 4, 12, 15, 58, 0, 907300)} 
2013-04-12 11:58:03-0400 [traffics] INFO: Spider closed (finished)

为什么说它肯定会抓取（然后将它们保存到数据库）的0个项目和0个页面？

来源

2013-04-18 Bak

你在哪里“看到通过数据库管道存储的项目”？ –

@stevenalmeroth对不起，我的意思是用'sqlite3'命令查看数据库。数据肯定存储。 – Bak

这听起来像数据可能被缓存，尝试从sqlite中清除数据。管道默认情况下不运行而不刮取物品。 –

数据库管道中的process_item方法是否在存储后返回项目？

来源

2013-04-18 17:36:51 Drover

是的，我返回数据库管道中的项目。 – Bak

Scrapy指出没有页面/项目已被抓取？

回答

相关问题