不同表示我有一个波斯语字,如果示于UTF-8编码是这样的:两个单词与UTF-8相同的表示有在ASCII
"خطاب"
我有该单词的两个版本,在UTF-8的Notepad ++中都如上所示。 但是,如果我看着他们在ANSI模式下,然后我看到:
ïºïºŽï»„ﺧ
和另外一个我看:
خطاب
为什么同样的话在ANSI格式,不同的表现?当我在Python中使用PIL来绘制它们时,结果对于其中的一个是正确的,对于另一个不正确。
我欣赏这方面的任何帮助。
它[取决于您的系统设置](http://stackoverflow.com/a/701920/847349)。 ANSI可能不包含波斯语代码页 –
如果您正在以ANSI编码解释UTF-8编码文件,那么您当然会看到垃圾字符。这不是关于他们“具有不同的表示”,而是关于以不正确的编码解释文件。请参阅[每个程序员都绝对,积极需要了解编码和字符集以处理文本](http:// kunststube。净/编码/)。 – deceze
@deceze非常感谢您的链接,我会一一阅读。但是,即使在ANSI编码中,我也应该看到垃圾,不应该两个都显示相同的垃圾吗? – TJ1