我从这个old discussion来了,但解决方案并没有多大帮助我的原始数据进行编码的不同:json.dumps带有 U转义的unicode为utf8
我的原始数据是采用Unicode已编码,我需要作为输出UTF-8
data={"content":u"\u4f60\u597d"}
当我尝试转换为UTF:
json.dumps(data, indent=1, ensure_ascii=False).encode("utf8")
输出我得到的是 "content": "ä½ å¥½"
和预期的出放应 "content": "你好"
我尝试没有ensure_ascii=false
和输出变为纯转义"content": "\u4f60\u597d"
我如何转换之前带有\ U转义的JSON为UTF-8 ?
您正在读取错误编解码器中的UTF-8数据。您**拥有** UTF-8,但将其解码为Latin-1或CP1252。换句话说,这不是一个Python问题。 –
是的,我无法在Python 3 REPL中指出这个问题。 –