2016-01-29 51 views
1

有没有人绊倒了一个伟大的Java实用程序来将各种Unicode的字节流转换为UTF8字符串?将各种Unicode的字节流转换为一个UTF8字符串

我需要解决的问题是我获取字节流中的数据,可以说它的html,它包含UTF8,UTF-16LE,UTF-16BE,并且在所有语言中,我希望将其规范化为单个字符串的UTF8。它也应该是非常快的,但我希望找到一个最低限度运作良好的东西。

此外,不同的编码可以在流中的任何位置。这就是说它的本质是随机的。它不一定是html,它可以是任何字面。

回答

0
+0

可悲的是这些客户没有任何价值。这些仍然要求你知道每个字节的charset是什么。问题是你有一个字节blob随机混合字符集这是真正的问题。恐怕它只能做到蛮力。谢谢。 – pdread

相关问题