1
我正在处理一个html文件..我用html清理器来清理html文件,然后格式发生了变化(所有'e's都被替换为+)...我怎样才能改正java中的问题UTF8编码问题
我正在处理一个html文件..我用html清理器来清理html文件,然后格式发生了变化(所有'e's都被替换为+)...我怎样才能改正java中的问题UTF8编码问题
在你正在做的事上发布一些代码。这里是一个答案,我到了一个类似question
FileInputStream fis = new FileInputStream("filename");
BufferedReader reader = new BufferedReader(new InputStreamReader(fis, "UTF-16"));
这是奇怪的,因为即使你撰写这两个ASCII字符'+®'作为单个Unicode字符('0x2BAE')这是一个未分配的Unicode码点。而'e'在ASCII和UTF8中是相同的。想知道它可能试图从哪个编码转换为? – 2011-03-17 15:56:43