下载HTML页面供离线使用

我想通过下载HTML和所有图像/ CSS资源，但不是链接的其他页面使HTML页面可供离线查看。下载HTML页面供离线使用

我在看httrack和wget但找不到正确的参数集（我需要命令行）。

任何想法？

2011-07-16 Yaron Naveh

你试过wget -p吗？您可能还需要-k（转换链接），以便下载的HTML文件中的href标记仍然可以工作。 – tdammers

谢谢 - 它不会下载图像。我看到有关版本1.12的一些帖子对我的场景有更好的支持。这是真的，如果是这样，我怎么能得到它的Windows？ –

如果你想使用的wget最新版本下载，使用cygwin的安装程序得到它，并使用此版本

wget -m –w 2 –p -E -k –P {target-dir} http://{website}

镜像{网站}到{目标目录}（不含1.11图像。 4）。

退出-w 2加快进度。

来源

2011-07-16 14:09:06 marc

我收到“无法识别的选项”--HTML-扩展名“”。我使用wget 1.11.4 for windows。当我删除它运行的HTML扩展标志但输出奇怪的消息“Resolving \ 226w ... failed：Unknown host。”他们的意思是什么？它确实保存了该网站，但没有html数据。 –

尝试新的命令行。如果您将错误消息粘贴到某处，它将会有所帮助。 – marc

谢谢，但它不下载图像 –

-1

对于一页，以下wget命令行参数应该足够了。请记住，它可能无法下载的一切，包括连接到CSS文件等

wget -p <webpage>

也可以尝试wget --help所有命令行参数的清单背景图像。

来源

2011-07-16 14:51:01

这不会下载图像。我不确定我应该使用哪个参数 –

-p是为了下载图像。也许你的图像作为背景图像嵌入到样式表中？从帮助页面：-p，--page-requisites获取显示HTML页面所需的所有图像等。 –

下载HTML页面供离线使用

回答

相关问题