2011-07-16 50 views
2

我想通过下载HTML和所有图像/ CSS资源,但不是链接的其他页面使HTML页面可供离线查看。下载HTML页面供离线使用

我在看httrackwget但找不到正确的参数集(我需要命令行)。

任何想法?

+1

你试过wget -p吗?您可能还需要-k(转换链接),以便下载的HTML文件中的href标记仍然可以工作。 – tdammers

+0

谢谢 - 它不会下载图像。我看到有关版本1.12的一些帖子对我的场景有更好的支持。这是真的,如果是这样,我怎么能得到它的Windows? –

回答

4

如果你想使用的wget最新版本下载,使用cygwin的安装程序 得到它,并使用此版本

wget -m –w 2 –p -E -k –P {target-dir} http://{website} 

镜像{网站}到{目标目录}(不含1.11图像。 4)。

退出-w 2加快进度。

+0

我收到“无法识别的选项”--HTML-扩展名“”。我使用wget 1.11.4 for windows。当我删除它运行的HTML扩展标志但输出奇怪的消息“Resolving \ 226w ... failed:Unknown host。”他们的意思是什么?它确实保存了该网站,但没有html数据。 –

+0

尝试新的命令行。如果您将错误消息粘贴到某处,它将会有所帮助。 – marc

+0

谢谢,但它不下载图像 –

-1

对于一页,以下wget命令行参数应该足够了。请记住,它可能无法下载的一切,包括连接到CSS文件等

wget -p <webpage> 

也可以尝试wget --help所有命令行参数的清单背景图像。

+0

这不会下载图像。我不确定我应该使用哪个参数 –

+0

-p是为了下载图像。也许你的图像作为背景图像嵌入到样式表中? 从帮助页面:-p,--page-requisites获取显示HTML页面所需的所有图像等。 –

相关问题