2010-10-25 52 views
1

我需要用Python编写的好网络爬虫将完整页面存储到mysql数据库。我正在试验的小型系统现在使用PHP Sphider来抓取并存储到数据库中。我需要的东西几乎与sphider完全一样,但是用Python编写。所以只需将数据库存储到其他脚本中,从其他脚本获取内容并完成我需要的其余工作。 Sphider很慢,并且想要替换它。Python网络爬行和存储到MySQL

所以,我看scrapy和一些其他项目,但任何东西都没有在我的需求脚,这是我开始编码自己之前的最后一次尝试,所以如果有人知道什么可以解决我这个问题,请告诉我。

+0

是有一个原因不能使用scrapy,然后重写save函数将数据存入mysql数据库。您甚至可以使用SQLAlchemy等ORM来更轻松地保存和检索信息。 也许如果你告诉我们为什么scrapy不足,那么我们可以有更多的帮助。 – JudoWill 2010-10-26 14:50:01

+0

http://scrapy.org/应该做你正在寻找的东西 – ScraperWiki 2010-10-26 10:08:38

回答