2015-05-04 73 views
3

我使用wget下载整个网站。
我用follwing命令(在Windows 7):如何恢复wget镜像网站?

wget^
--recursive^
-A "*thread*, *label*"^
--no-clobber^
--page-requisites^
--html-extension^
--domains example.com^
--random-wait^
--no-parent^
--background^
--header="Accept: text/html" --user-agent="Mozilla/5.0 (Macintosh; Intel Mac OS X 10.8; rv:21.0) Gecko/20100101 Firefox/21.0"^
    http://example.com/ 

2天后,我的小兄弟重新启动PC
所以我试图恢复已停止的进程
添加以下到命令

--continue^

,使代码看起来像

wget^
    --recursive^
    -A "*thread*, *label*"^
    --no-clobber^
    --page-requisites^
    --html-extension^
    --domains example.com^
    --random-wait^
    --no-parent^
    --background^
    --continue^
    --header="Accept: text/html" --user-agent="Mozilla/5.0 (Macintosh; Intel Mac OS X 10.8; rv:21.0) Gecko/20100101 Firefox/21.0"^
     http://example.com/ 

不幸的是它再次启动它下载相同文件创建一个新的工作,并编写了一个名为

wget-log.1 

一个新的日志文件,反正是有恢复镜像网站与wget的或确实有我要重新开始整个事情?

回答

2

尝试-nc选项。它再次检查所有内容,但不会下载它。

我使用此代码下载一个网站: wget -r -t1 domain.com -o log

我已经停止的过程中,我想重新开始,所以我改变了代码: wget -nc -r -t1 domain.com -o log

在日志中有是这样的: File .... already there; not retrieving. etc.

我在此之前检查日志,似乎在这种类型的检查5分钟后,它开始下载新文件。

我正在使用wget的本手册:http://www.linux.net.pl/~wkotwica/doc/wget/wget_8.html