我试图检索网站,并使用Python Mechanize将它们保存在本地磁盘上。问题是许多网站重定向到html/asp/php以外的链接。有没有准确的方法来检测URL的扩展名以及它将检索的文件类型?Python机械化检测下载的文件扩展名
例如: http://www.yahoo.com 应保存为html文件。
http://www.microsoft.com/en-us/download/confirmation.aspx?id=3745 应该保存为.exe文件,因为它会重定向,然后下载一个exe文件。内容类型被声明为text/html,所以这不是我猜测的最可靠的方法。
如何准确检测浏览器在保存文件时的文件扩展名?因为它重定向
感谢堆