我必须下载所有站点内容,然后解析下载的文件夹以查找“* .pdf”文件。我下载的网站使用wget -r --no-parent http://www.example.com/
但问题是,有时链接看起来这Wget文件格式
http://www.foodmanufuture.eu/dpubs?f=K20
和dowloaded PDF下载名称为“dpubs?F = K20”和文件格式没有指定,它看起来并不像这样“dpubs?f = K20.pdf”,有没有办法检查我在这个文件夹中有多少pdf文件?
太棒了!谢谢! –