2013-01-25 54 views
1

我有一台设置htaccess的服务器。当我想从中下载文件,我只是执行:wget创建了许多其他文件

wget -r --user="user" --password="password" -q 'http://server'

所有文件被下载,但wget每个目录中也创造了许多其他文件index.html?something,我必须manualy删除它们。是否有可能不创建该文件?

+0

“东西”与什么关联?它是由爬网触发的帖子变量,它是用户名吗? – dongle

+0

它创建的文件如下:'index.html?A = B&C = D'我认为奇怪的是因为'index.html'是一个静态页面,没有任何像PHP或JavaScript的东西。 –

+0

如果没有看到您尝试抓取的内容,则很难进一步提供建议。 – dongle

回答

1

--accept--reject选项,如果你的wget suppors他们的版本:

-A acclist --accept acclist 
-R rejlist --reject rejlist 

指定文件名后缀或图案的逗号分隔的列表,以接受或拒绝。请注意, 如果任何通配符字符*,?,[或]出现在acclist或rejlist的元素中,它将被视为模式,而不是后缀。

相关问题