0
我发现了一些我想要提取的数据(http://www.education.gov.uk/edubase/public/quickSearchResult.xhtml?page=1),但是我需要扫描1080页,有没有人知道为他们的<table>
元素刮取多页的方法?从多个页面中提取数据
我发现了一些我想要提取的数据(http://www.education.gov.uk/edubase/public/quickSearchResult.xhtml?page=1),但是我需要扫描1080页,有没有人知道为他们的<table>
元素刮取多页的方法?从多个页面中提取数据
我想你想尝试IRobotSoft网页抓取。它是免费的并提供可视化界面。先看看http://www.irobotsoft.com/help/的演示。他们的论坛也非常有帮助。
对语言的任何偏好? Scrapy在Python中是一个很好的框架,用于这种类型的抓取(http://doc.scrapy.org/en/latest/index.html) –
最好是PHP,但只要能够获取数据,它并不重要 –