我收到一些奇怪的字符作为对网页的回应。我很确定它是用俄语写的,但编码似乎很奇怪。网页信息告诉我编码是ISO-8859-1。这是示例回应。确定文字的编码
Âû ñòðàíè÷êå ïðåâüþøêàìè
是否有解密此响应的方法?答案是否可以挽回?
我收到一些奇怪的字符作为对网页的回应。我很确定它是用俄语写的,但编码似乎很奇怪。网页信息告诉我编码是ISO-8859-1。这是示例回应。确定文字的编码
Âû ñòðàíè÷êå ïðåâüþøêàìè
是否有解密此响应的方法?答案是否可以挽回?
它看起来像编码实际上是西里尔文Windows-1251。相应地切换您的网页浏览器编码。
例如,在编码提供的文字是:
Выстраничкепревьюшками
其中自动翻译说的意思是 “你网页预览”。
几乎不可能自动识别8位编码,因为所有字节组合在技术上都是有效的。在这种情况下,我敢肯定它是Windows-1251,因为角色是相当有意义的有:
Выстраничкепревьюшками
这显然不是ISO-8859-1。
对于这种转换成Unicode字符串,用decode
方法:
b = "Âû ñòðàíè÷êå ïðåâüþøêàìè".encode("Latin-1") # simulate the incoming byte string
u = b.decode("Windows-1251")
print(u)
ISO-8859-1 = ASCII – 2011-01-28 14:05:28
我得到了响应,字节串。现在我知道了编码,我该如何使用python脚本来解码文本? – Neo 2011-01-28 14:36:54