2011-06-28 141 views
24

如果我给你的unicode原始文字到一个变量,我可以读取它的值:如何解码unicode原始文字为可读的字符串?

>>> s = u'\u0421\u043e\u043e\u0431\u0449\u0435\u043d\u0438\u0435 \u043e\u0442\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u043e' 
>>> s 
u'\u0421\u043e\u043e\u0431\u0449\u0435\u043d\u0438\u0435 \u043e\u0442\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u043e' 
>>> print s 
Сообщение отправлено 

但是,当我已经分配的值到平原,没有unicode字符串,我不能:

>>> s = '\u0421\u043e\u043e\u0431\u0449\u0435\u043d\u0438\u0435 \u043e\u0442\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u043e' 
>>> s 
'\\u0421\\u043e\\u043e\\u0431\\u0449\\u0435\\u043d\\u0438\\u0435 \\u043e\\u0442\\u043f\\u0440\\u0430\\u0432\\u043b\\u0435\\u043d\\u043e' 
>>> print s 
\u0421\u043e\u043e\u0431\u0449\u0435\u043d\u0438\u0435 \u043e\u0442\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u043e 

我如何解码并阅读它?

回答

31

使用unicode_escape codec

s.decode('unicode_escape') 
+3

(原因是'\ uXXXX'在非Unicode字符串文字中是* verbatim *。) – 2011-06-28 16:08:35

+0

找到了有史以来最适合俄文字符的最佳解决方案 –

0

如果您解码尝试以下

print repr(s).decode('unicode-escape').encode('latin-1') // or encode using some other encoding 

这可能是蟒蛇终端使用的是默认的ASCII时,并有符号,它超出越来越怪异结果范围。

相关问题