0
我被给了一些文字在我的程序中显示。不过,我用textedit打开它,文本不可读。我被告知这是汉字。我需要做些什么才能使其可读?如何转换下列中文字符?
•—§WƸ¨v∞”¡`∑|™∫•|¶Ï•N™Ì
我正在使用OSX来打开此文件。文件是文本格式。以上是一个示例行。
我被给了一些文字在我的程序中显示。不过,我用textedit打开它,文本不可读。我被告知这是汉字。我需要做些什么才能使其可读?如何转换下列中文字符?
•—§WƸ¨v∞”¡`∑|™∫•|¶Ï•N™Ì
我正在使用OSX来打开此文件。文件是文本格式。以上是一个示例行。
•-§WƸ¨v∞”¡`Σ|™∫•|¶Ï•无™I
也就是说,如果你阅读的文本文件作为是诸如此类的事情,你得到在MacRoman编码时,它实际上包含其他内容。
也许只是你的文本编辑器已经猜到了MacRoman,因为它没有其他任何东西可以继续。这是可以想象的文本文件是错位的,并保存在UTF-东西这些字符,但更可能多的文件的字节为:
A5 D1 A4 57 AE FC AC 76 B0 D3 C1 60 B7 7C AA BA A5 7C A6 EC A5 4E AA ED
而且这些字节看我像不像大五。用Big-5字符集解码它们会得到:
由上海洋商總會的四位代表
看起来很可能。
所以要读取文件需要的字节并使用Big-5字符集进行解码。你如何做到这一点取决于你使用的是什么语言。
你还没有告诉我们你正在使用什么平台,或者你正在阅读什么文件,或者你对数据的了解。基本上这个问题目前是不可能回答的。 –