2012-05-05 52 views
0

我从DBpedia中使用耶拿和自耶拿的输出是基于XML得到了一些数据,因此也有一些情况是XML字符需要区别对待类似以下内容:这是什么样的编码?

Guns n ' Roses 

我只是想知道什么样的的经费是这个吗? 我想根据上面的编码(r)在javascript的帮助下对我的输入进行解码/编码,并将它发送回servlet。

(编辑后,如果您删除&之间的空间和功放,你会得到正确的字符,因为在计算器我无法找到一个方法来做到这一点,我决定把这样的!)

+0

这是编码两次,这是(很可能)一个错误。这发生在哪里? –

回答

2

似乎是XML实体编码,并且数字字符引用(十进制)。

数字字符引用是指一个角色通过其Universal Character Set/Unicode代码点,并使用格式

你可以在这里得到一些信息:List of XML and HTML character entity references on Wikipedia

你的字符数是39,为撇号:',其也可以与字符实体引用引用:'

要使用Javascript对此进行解码,可以使用例如php.js,该函数具有html_entity_decode()函数(注意取决于get_html_translation_table())。


UPDATE:在回答您的编辑:基本上是一样的,唯一不同的是,这是(错误可能)编码两次&是&符号:&