我正在创建一个博客引擎,它包含一个输入整篇文章的<textarea>
。将文档从Word文档复制到网页时发生更改
然后我用Ajax和它存储在GAE数据存储
的问题提供了Text
变量:嵌入时 如果用户复制从Word文档中的文本,其中我看到屏幕上的各种随机字符在网页上。 我知道这是因为这个词文件使用XML编码和HTML页面使用UTF-8编码(对我来说)
问题: 如何改变输入的文本的编码? 或者我该如何避免XML编码? 或者如果改变我的网页编码可能有助于解决这个问题?
需要注意的事项: 我想使它自动化..我在Google上读到,您应该首先将文本复制到一些简单的文本编辑器,它将格式化编码并将它们复制到网页中。 但是这个选项对我来说是不可行的。
此外,我之前曾用过weebly,那时候我从一个word文件复制文本,如果有人知道如何管理编码冲突的话会有多么可怕!
答案有望在Java :)
您的上述代码是否处理所有冲突?还是仅仅是一个例子?如果是,那么我可以在哪里获得完整列表? – leo
很可能它会处理所有标准中不同的东西。给一个尝试,让我知道你的输出 –
你只需要调用这个函数其余的东西这个函数将做 –