2014-09-30 31 views

回答

2

我不知道chardet宝石,但在https://github.com/jmhodges/rchardet上读取5分钟的代码后找到了答案。

  • UTF-8是由不同探测头,包括UniversalDetectorUTF8Prober
  • ASCII是UTF-8的一个子集,拉丁-1等的支持。它由UniversalProber直接检测到。
  • ISO-8859-1(也称为拉丁-1)是由Latin1Prober
  • 的Windows 1252,这是非常相似的Latin-1支持(这取决于不可微数据)也被支持Latin1Prober

至于你的一般问题,你应该养成阅读你使用的宝石代码而不是文档的习惯。这不仅有助于理解宝石的作用,还有助于理解宝石如何做到这一点,以及它做得怎么样,哪些做得不好。此外,阅读代码使你永远是一个更好的程序员。

+0

当然!将从现在开始! :) – 2014-09-30 07:59:04

相关问题