0
我正在通过这个(1)教程。Scrapy找不到蜘蛛
我我从命令行scrapy项目创建一个文件夹中的工作:
用户/ MYNAME /桌面/ MyProject的/ MyProject的/蜘蛛/ MyProject_spider.py
我代码是
import [everything necessary]
class myProjectSpider(CrawlSpider):
name = 'myProject'
allowed_domains = ['http://www.reddit.com/r/listentothis']
start_urls = ['http://www.reddit.com/r/listentothis']
rules = (Rule(LinkExtractor(allow=('http://www.reddit.com/r/listentothis/.+'), deny_domains=('www.youtube.com', 'www.soundcloud.com', 'www.reddit.com/user/.+')),'parse_start_url',follow=False),)
def parse_start_url(self, response):
hxs = HtmlXPathSelector(response)
title1 = hxs.select('class="Title"').extract(text)
yield request
在命令行,我导航到桌面> MyProject的并输入
scrapy crawl myProject
的错误,我总是得到的是
“蜘蛛没有发现:myProject的。”
我试过使用不同的名称(使蜘蛛名称与类名匹配,使得类跛足匹配文件名,使得文件名匹配项目名称以及上述的每个组合),并且我试图从项目中的不同文件调用命令。
是的。对不起,那个点只是一个错字。不知道那是怎么回事。 – litmuz