我通过wget在Windows下载一个HTML页面及其文件。
wget -m -k -p -np --html-extension
wget特殊字符内部URL
这个html有很多特殊字符的url。
(例如:<a href="chp1_資料庫概論.doc" target="_blank">Chp1</a>
)
有2个问题:
- 内的HTML,网址(包括特殊字符的)变得有些乱语:
期望:
<a href="chp1_資料庫概論.doc" target="_blank">Chp1</a>
实际:
<a href="http://acupun.site/lecture/database/chp1_%B8%EA%AE%C6%AEw%B7%A7%BD%D7.doc" target="_blank">Chp1</a>
- 文件名是随机的话。
可以通过添加--restrict-file-names=nocontrol
来解决seconed问题。
如何解决第一个问题?这是Windows版本的问题?
显然,里面的HTML,将其转换网址有特殊字符的东西......