我想要的网页得到了windows-1251字符集编码。 有没有办法不只是简单地下载这个页面,而是自动..呃..将文本内部转换为uft-8?使用wget改变文本编码下载文件
我试图添加额外的参数给wget像
--header='Accept-Charset: utf-8'
,但没有运气。
我想要的网页得到了windows-1251字符集编码。 有没有办法不只是简单地下载这个页面,而是自动..呃..将文本内部转换为uft-8?使用wget改变文本编码下载文件
我试图添加额外的参数给wget像
--header='Accept-Charset: utf-8'
,但没有运气。
您可以使用
iconv -f ISO-8859-1 -t UTF-8 ./index.html > ./utf.html
的编码转换。请参阅https://wiki.archlinux.org/index.php/Convert_a_text_file%27s_encoding
您可以举个例子吗? – NoBugs
当然,http://www.popmech.ru/article/12858-kosmicheskiy-grom/ – Astro