2012-08-16 63 views
-1

我正在使用SOAP,并收到以下XML值。如何解码这个字符串?

<Name>&#xD0;&#x98;&#xD0;&#xBC;&#xD1;&#x8F;&#xD0;&#x98;&#xD0;&#xBC;&#xD1;&#x8F;&#xD0;&#x98;&#xD0;&#xBC;&#xD1;&#x8F;&#xD0;&#x98;&#xD0;&#xBC;&#xD1;&#x8F; &#xD0;&#x98;&#xD0;&#xBC;&#xD1;&#x8F;&#xD0;&#x98;&#xD0;&#xBC;&#xD1;&#x8F;&#xD0;&#x98;&#xD0;&#xBC;&#xD1;&#x8F;&#xD0;&#x98;&#xD0;&#xBC;&#xD1;&#x8F;</Name> 

发件人告诉我这是俄文,但我不知道如何解码它。当我用.net解码时,我得到的只是“???????”

即使是一个有效的编码字符串?这叫什么?

+1

如果是UTF-8字节为HTML字符实体,则该字符串为“ИмяИмяИмяИмяИмяИмяИмяИмя ”。 – MRAB 2012-08-16 19:13:06

+0

MRAB //是的,这正是发件人所说的。你是如何解码它的? – Moon 2012-08-16 19:55:12

+1

我用Python 3:'import re;字符串= b”的 Ð Ð ˜ ¼ Ñ  Ð Ð ˜ ¼ Ñ  Ð Ð ˜ ¼ Ñ  Ð Ð ˜ ¼ Ñ  Ð Ð ˜ ¼ Ñ  Ð Ð ˜ ¼ Ñ  Ð Ð ˜ ¼ Ñ  Ð Ð ˜ ¼ Ñ “; re.sub(br“&#x(\ w +);”,lambda m:bytes([int(m.group(1),16)]),string).decode(“utf-8”)' – MRAB 2012-08-16 21:41:39

回答

2

这看起来像html实体给我。 要解码它,你需要源编码。例如KOI8-R

你可以试着围绕这个工具:http://2cyr.com/decode/?lang=en 这是一个通用的在线西里尔解码器

+0

Thanks !这是非常有用的工具! – Moon 2012-08-16 20:09:16