2014-07-08 57 views
0

我正在构建一个nodejs网络爬虫,但我遇到了一些charset问题。不同的网站有不同的字符集,如UTF-8,windows-1252,iso-8859-1等。Node.js请求charset问题

如何调整我的请求以将所有不同于UTF-8的字符集转换为UTF-8?因为如果我什么都不做,只是用cheerio来解析内容,我会得到像“ib rica”这样的奇怪符号,其中“ ”应该是“é”

回答

1

还有iconv(需要编译)和iconv-lite(不需要编译)用于在节点中的字符集之间进行转换。