我想获得这两个网站的牛皮癣患者的临床图像为研究目的:如何从网站上刮取全尺寸图像?
http://www.dermis.net/dermisroot/en/31346/diagnose.htm
http://dermatlas.med.jhmi.edu/derm/
对于第一个网站,我尝试了保存页面与Firefox,但它只保存了缩略图而不是全尺寸的图像。我能够使用名为“downloadthemall”的firefox插件访问全尺寸图像,但它将每个图像保存为新的html页面的一部分,我不知道任何提取图像的方法。
我也尝试过在我的大学的一台linux机器上使用wget来镜像网站,但我无法使其工作,并且仍然不确定原因。因此,我想知道是否可以很容易地写出一个简短的脚本(或任何方法是最简单的),以(a)获得第一个网站链接到的全尺寸图像,和(b)获得全部完整第二个网站上的图像文件名为“牛皮癣”。
我已经编程了几年,但没有web开发经验,并会很乐意就如何去做这件事的任何建议。
警告:在链接图像皮肤病,如果你是吃不查看。 – 2012-03-07 00:07:37
您可能需要一个网站镜像程序,例如httrack(http://www.httrack.com/)。只要告诉它只保存图像。有很多文件。 – Borealid 2012-03-07 00:15:11