0
我正在尝试使用表情符号的html代码或十六进制代码使用Java将带有表情符号内容的文本文件转换为文件。 例如:将表情符号转换为HTML十进制代码或Unicode十六进制代码在java中
I/P:<div id="thread" style="white-space: pre-wrap;"><div>⚽️
预期O/P:<div id="thread" style="white-space: pre-wrap;"><div>😀😀😃🍎🍏⚽️🏀
在上述出放''
应该得到改变到相应的HTML实体代码'& # 128512;'
详细的Html实体代码和十六进制代码在这里给出: http://character-code.com/emoticons-html-codes.php
示例代码我试着低于:
try {
File file = new File("/inFile.txt");
str = FileUtils.readFileToString(file, "ISO-8859-1");
System.out.println(new String(str.getBytes(), "UTF-8"));
String results = StringEscapeUtils.escapeHtml4(str);
System.out.println(results);
} catch (IOException e) {
e.printStackTrace();
}
所以你的代码做一些事情,你不告诉我们的代码,然后问为什么代码不能正常工作? *真的吗?!?!?* – Andreas
添加了我试过的示例代码。 –
你确定该文件使用ISO-8859-1编码吗?这似乎......不太可能。 – dnault