我正在研究一个Java插件,它允许人们通过指定他们希望使用的字符集编码来写入和读取文件。然而,我很困惑我将如何在单个文件中编码多个编码。例如,假设A字符来自一个字符集,而B字符来自另一个字符,是否可以将“AAAAABBBBBAAAAA”写入文件?一个文件可以用Java中的多个字符编码吗?
如果这是不可能的,这对于任何编程语言或专门用于Java的情况通常都是如此吗?如果可能的话,我将如何继续读取(解码)文件?
我不想使用Charset的encode()和decode()方法,因为他们的测试失败了(某些字符集没有正确解码)。我也不想因为各种原因使用第三方程序,所以这个问题的范围纯粹是在标准的Java包/代码中。
非常感谢!
N.S.
你可以写从不同的编码到同一个文件产生的字节,但你不一定能够在不知道从哪里字符编码之间的边界所在的文件进行解码。当读取应被解码成B中的字节,你需要知道得到的字符是否是B.鸡和蛋的问题。 –