从多个页面中提取数据

我发现了一些我想要提取的数据（http://www.education.gov.uk/edubase/public/quickSearchResult.xhtml?page=1），但是我需要扫描1080页，有没有人知道为他们的<table>元素刮取多页的方法？从多个页面中提取数据

对语言的任何偏好？ Scrapy在Python中是一个很好的框架，用于这种类型的抓取（http://doc.scrapy.org/en/latest/index.html） –

最好是PHP，但只要能够获取数据，它并不重要 –

我想你想尝试IRobotSoft网页抓取。它是免费的并提供可视化界面。先看看http://www.irobotsoft.com/help/的演示。他们的论坛也非常有帮助。

2013-07-19 04:05:11 seagulf

回答