2013-02-19 24 views
0

我需要wget在递归时遵循重定向,例如, host.com到www.host.com。通常它不会递归到子域,并且它试图下载整个互联网。如何让它只需要所需网站的子域名(或至少到www。子域名)?如何在wget中的主机名内重定向?

+1

wget默认遵循重定向。我误解了这个问题吗? – 2013-02-19 15:43:39

+0

但重定向时不会递归。例如。如果您下载www.host.com,您将获得整个站点,但是如果'wget'以host.com开头,并且它重定向到www.host.com,那么'wget'只下载index.html并在那里停止。 – forester 2013-02-19 15:54:54

回答

0

这个怎么样?

-D "foo.com,b.foo.com" -H 
+0

这是非常严格的,例如对于数百个网站,我需要启动wget数百次,而不仅仅是启动它,然后遍历列表'-i',否则它将起作用。 – forester 2013-02-19 16:37:51