如何从网站上刮取全尺寸图像？

我想获得这两个网站的牛皮癣患者的临床图像为研究目的：如何从网站上刮取全尺寸图像？

对于第一个网站，我尝试了保存页面与Firefox，但它只保存了缩略图而不是全尺寸的图像。我能够使用名为“downloadthemall”的firefox插件访问全尺寸图像，但它将每个图像保存为新的html页面的一部分，我不知道任何提取图像的方法。

我也尝试过在我的大学的一台linux机器上使用wget来镜像网站，但我无法使其工作，并且仍然不确定原因。因此，我想知道是否可以很容易地写出一个简短的脚本（或任何方法是最简单的），以（a）获得第一个网站链接到的全尺寸图像，和（b）获得全部完整第二个网站上的图像文件名为“牛皮癣”。

我已经编程了几年，但没有web开发经验，并会很乐意就如何去做这件事的任何建议。

警告：在链接图像皮肤病，如果你是吃不查看。 – 2012-03-07 00:07:37

您可能需要一个网站镜像程序，例如httrack（http://www.httrack.com/）。只要告诉它只保存图像。有很多文件。 – Borealid 2012-03-07 00:15:11

尝试HTTrack网站复印机 - 它会加载网站上的所有图像。您也可以尝试http://htmlparser.sourceforge.net/。如果您在org.htmlparser.parserapplications中指定它，它将抓取网站.SiteCapturer

2012-03-07 00:22:10 aretai

为什么不使用wget递归下载域中的图像？这里有一个例子：

wget -r -P /save/location -A jpeg,jpg,bmp,gif,png http://www.domain.com

2012-03-07 00:32:14 danielbeard

回答