可能重复:
How to get string Objects instead Unicode ones from JSON in Python?的Python:从转换Unicode字符串的复杂字典ASCII
我有很多输入从JSON API调用解析多层次的字典。这些字符串都是unicode,这意味着有很多u'stuff like this'
。我使用jq来播放结果并需要将这些结果转换为ASCII。
我知道我可以写一个函数,只是转换它这样:
def convert(input):
if isinstance(input, dict):
ret = {}
for stuff in input:
ret = convert(stuff)
elif isinstance(input, list):
ret = []
for i in range(len(input))
ret = convert(input[i])
elif isinstance(input, str):
ret = input.encode('ascii')
elif :
ret = input
return ret
这甚至是否正确?不确定。这不是我想问你的。
什么我问的是,这是一个典型的暴力解决问题的方法。一定会有更好的办法。更pythonic的方式。我不是运算法则的专家,但是这个看起来并不是特别快。
那么,有没有更好的办法?或者,如果没有,这个功能可以改进...?
后答案编辑
Mark Amery's answer是正确的,但我想张贴它的修改版本。他的函数可以使用Python的2.7+和我在2.6所以不得不将它转换:
def convert(input):
if isinstance(input, dict):
return dict((convert(key), convert(value)) for key, value in input.iteritems())
elif isinstance(input, list):
return [convert(element) for element in input]
elif isinstance(input, unicode):
return input.encode('utf-8')
else:
return input
如果你使用的是Python 2,那么unicode不是'str'的实例,而是'unicode'的实例。另外,在'list'和'dict'处理中,你做错了。 – agf
对于列表案例,您不妨考虑处理任何迭代。无论如何,你可以用'ret = [convert(x)for x in input]'替换if语句的分支。另外,检查你的字典案例。 'ret'将只包含字典中最后一个键转换成的内容。 –
@MichaelMior按照你所描述的方式处理任何迭代的麻烦是,并非所有的迭代器都是类似列表的。例如,字典是可迭代的,但如果'input'是一个字典,'ret = [convert for(x)in input]'显然不是我们想要的。 –