2013-11-22 67 views
-2

给定一个网站的URL。 有没有办法遍历网站上的所有链接,并跟踪文本文件或其他内容中的所有页面。我想为此使用Selenium。 但是,其中一些弹出的对话框将位于每个页面的每个页眉和页脚上。所以显然要跟踪访问过的链接,不要再回头看看。c#经过整个网站

谢谢。

+0

是的,这是可能的。你有更具体的问题吗? – DGibbs

+0

这是关于非常高水平的任务的问题,像这样的问题并没有真正的赞赏,因为它们表明你在问之前做了很少的努力。 – Andrey

+0

这被称为网页抓取 –

回答

0

尝试Scrapy:http://scrapy.org/

Scrapy是一个快速的高层次的屏幕抓取和Web爬行框架,用来抓取网站,并从自己的网页中提取结构化数据。它可用于广泛的用途,从数据挖掘到监视和自动化测试。