2012-01-10 142 views
0

我现在正在构建蜘蛛,我正在研究如何以字节为单位测量网页总重量。通过我的研究,我发现了这个问题,最简单的答案是获取页面的内容长度。但是有一个小问题,以字节为单位的内容长度并没有告诉我们应该下载到浏览器的临时文件夹的图像,也没有告诉我们任何有关应该下载到浏览器的临时文件夹的图像,也不是来自页面标题的JavaScript或CSS链接。所以我实际上支持了我的结论,关于如何实际测量页面,需要从服务器向客户端发送多少字节,以确保weppage正常工作所需的所有资源,而不是仅测量字节只有文件。 所以我做了资源的列表,一个网页浏览器应该下载当访问一个页面:浏览网页时,浏览器是否会下载可能的资源列表?

all images <img src="someimages.jpg" alt=”somedecription” > 
all js files <script type="text/javascript" src="somejs.js" ></script> 
all css files <link rel="stylesheet" type="text/css" href="somecss.css"> 
the ico file <link rel="shortcut icon" href="someico.ico"> 

是否有浏览器具有当它访问该网页下载任何其他资源?换句话说,浏览器在访问网页时下载的所有可能资源的列表是什么?

+1

视频怎么样?压缩文件?具有不同扩展名的图像(.png,.jpeg,.tiff,.gif等)? – 2012-01-10 18:03:46

+0

好的压缩文件是一个资源,我可以找到它,如果它可以通过download link访问,也可以从 themis 2012-01-10 18:08:38

+0

are you going to extract the '