2011-07-21 82 views
0

有没有什么方法可以将所有首次访问的网页下载到我的本地邮箱,并且所有后续访问都将从本地邮箱中检索数据,而不是从互联网中检索数据?也就是说,就像一个服务在端口上运行,如果我访问该端口而不是HTTP端口,我从本地框中获取数据?将网页保存到localbox

我需要使用此服务来解析其内容可能每次都会更改的网页,以便我可以使用相同的内容。

回答

2

您可以使用缓存代理,如squid

鱿鱼服务本地存储网页,下一个请求返回存储的文件。

+0

谢谢。我已经熟悉它了......它从来没有发生过我。 –

0

听起来你是在谈论一个代理服务器

+0

是的..类似的东西。 –

0

我需要使用这项服务来解析网页,其内容可能会改变

看一看的蜘蛛引擎,例如pavuk。