2012-03-07 33 views
0

我想获得这两个网站的牛皮癣患者的临床图像为研究目的:如何从网站上刮取全尺寸图像?

http://www.dermis.net/dermisroot/en/31346/diagnose.htm

http://dermatlas.med.jhmi.edu/derm/

对于第一个网站,我尝试了保存页面与Firefox,但它只保存了缩略图而不是全尺寸的图像。我能够使用名为“downloadthemall”的firefox插件访问全尺寸图像,但它将每个图像保存为新的html页面的一部分,我不知道任何提取图像的方法。

我也尝试过在我的大学的一台linux机器上使用wget来镜像网站,但我无法使其工作,并且仍然不确定原因。因此,我想知道是否可以很容易地写出一个简短的脚本(或任何方法是最简单的),以(a)获得第一个网站链接到的全尺寸图像,和(b)获得全部完整第二个网站上的图像文件名为“牛皮癣”。

我已经编程了几年,但没有web开发经验,并会很乐意就如何去做这件事的任何建议。

+0

警告:在链接图像皮肤病,如果你是吃不查看。 – 2012-03-07 00:07:37

+0

您可能需要一个网站镜像程序,例如httrack(http://www.httrack.com/)。只要告诉它只保存图像。有很多文件。 – Borealid 2012-03-07 00:15:11

回答

0

尝试HTTrack网站复印机 - 它会加载网站上的所有图像。您也可以尝试http://htmlparser.sourceforge.net/。如果您在org.htmlparser.parserapplications中指定它,它将抓取网站.SiteCapturer