修复网站的代码以使用CDN(将所有网址重写为图像,js & css), 我需要测试域上的所有页面以确保从CDN中获取所有资源。如何下载完整的网站?
所有的网站页面都可以通过链接访问,没有独立的页面。
目前我使用Firebug检查“网络”的观点......
有一些自动化的方式来给出一个域名,并请求所有页面+域的资源?
更新:
OK,我发现我可以使用wget
像这样:
wget -p --no-cache -e robots=off -m -H -D cdn.domain.com,www.domain.com -o site1.log www.domain.com
选项解释:
-p
- 下载资源太(图像,CSS ,js等)--no-cache
- 获得真正的对象,不返回服务器缓存的对象-e robots=off
- 无视robots
和no-follow
方向-m
- 镜像站点(跟随链接)-H
- 跨主机(遵循其他领域也是如此)-D cdn.domain.com,www.domain.com
- 指定要追踪的女巫域,否则将遵循页面中的每个链接-o site1.log
- 登录到文件site1.log-U "Mozilla/5.0"
- 可选:假的用户代理 - 有用的,如果服务器不同的浏览器www.domain.com
返回不同的数据 - 该网站下载
享受!
+1好的答案。 – Graham
谢谢你的详细解答! -H确实解决了我的问题。我确实希望从CDN下载文件以查看它们是否都正确链接,如果它们不是wget,将会出现错误。 – SimonW