2017-01-01 192 views
0

我正在通过这个(1)教程。Scrapy找不到蜘蛛

我我从命令行scrapy项目创建一个文件夹中的工作:

用户/ MYNAME /桌面/ MyProject的/ MyProject的/蜘蛛/ MyProject_spider.py

我代码是

import [everything necessary] 

class myProjectSpider(CrawlSpider): 
    name = 'myProject' 
    allowed_domains = ['http://www.reddit.com/r/listentothis'] 
    start_urls = ['http://www.reddit.com/r/listentothis'] 
    rules = (Rule(LinkExtractor(allow=('http://www.reddit.com/r/listentothis/.+'), deny_domains=('www.youtube.com', 'www.soundcloud.com', 'www.reddit.com/user/.+')),'parse_start_url',follow=False),) 

    def parse_start_url(self, response): 
     hxs = HtmlXPathSelector(response) 
     title1 = hxs.select('class="Title"').extract(text) 
     yield request 

在命令行,我导航到桌面> MyProject的并输入

scrapy crawl myProject 

的错误,我总是得到的是

“蜘蛛没有发现:myProject的。”

我试过使用不同的名称(使蜘蛛名称与类名匹配,使得类跛足匹配文件名,使得文件名匹配项目名称以及上述的每个组合),并且我试图从项目中的不同文件调用命令。

+0

是的。对不起,那个点只是一个错字。不知道那是怎么回事。 – litmuz

回答

0

从你需要运行scrapy runspider MyProject_spider ,如果你想抓取你需要创建一个项目,将在MyProject_Spider.py蜘蛛目录,然后去顶层目录,并运行scrapy crawl myProject当前文件夹。