我正在使用Scrapy来刮取网站。我想刮的项目页面如下所示:http://www.somepage.com/itempage/&page=x。其中x
是从1
到100
的任意数字。因此,我有一个SgmlLinkExractor
规则与任何类似的页面指定的回调函数。Scrapy - 没有列表页面,但我知道每个项目页面的网址
该网站没有所有项目的列表页面,所以我想以某种方式很好scrapy刮这些网址(从1
到100
)。这家伙here似乎有同样的问题,但无法弄清楚。
有没有人有解决方案?