2016-07-22 37 views
1

我已阅读Joel的关于编码的文章。正如我以Unicode的情况下理解:iso-8859-1的编码和字符集

  1. 的unicode是一个系统字符集 - 整数值和字符之间的映射
  2. UTF-8是被用于Unicode整数编码为提供它们以二进制查看

iso-8859-1?它是编码还是字符集或两者兼而有之?

+0

[什么是ANSI格式?](http://stackoverflow.com/questions/701882/what-is-ansi-format) – CodeCaster

+0

这是一个特定字符集的编码。 Unicode即将解决由这些8位编码引起的灾难。有太多的常用软件,像微软,苹果,Adobe,IBM这样的公司都在自己的角色集中选择了哪些角色作为不兼容的选择。 ISO通过添加16种更多的方法来解决问题。不要使用它。 –

回答

0

那么iso-8859-1呢?它是编码还是字符集或两者兼而有之?

从历史上看,它被描述为一个编码字符集:它定义了一组字符集,以及这些字符到字节值的映射 - 我们今天称之为编码,但没有明确描述这些条款。

创建Unicode时,它被设计为包含(几乎)广泛使用的字符集中的所有字符,因此它将由ISO-8859-1编码字符集定义的字节流重新编码为更宽通用字符集。

所以,如果你在一个现代的Unicode环境中工作,你会认为ISO-8859-1是一个编码。但是认为它也是一个字符集不能说是错的。 (还有其他的编码肯定不是字符集:例如UTF和像Shift-JIS这样的多字节编码,它本身被定义为在Unicode的扩展和缩放之前的JIS X 0208字符集的编码,拥抱。)

0

ISO 8859-1(Latin-1)是一个单字节编码。它代表了前256个Unicode字符。所以,只要是Unicode字符集的子集,我想它可以被视为编码和字符集。