2017-10-20 217 views
0

我需要转换什么,我认为是从硒unicode字符串转换为可读UTF8字符串(没有在字符串的开头uUnicode转换为UTF8字符串

但如果字符串已经是什么UTF8编码?然后多字节字符将被双重编码

td.text.encode('utf-8').strip() 
+0

您是否有具体问题? unicode字符串应该是编码不可知的,编码会给你一个字节字符串(基本上只是一个字节序列) – Felk

+0

Python中没有“UTF-8编码字符串”这样的东西。一个字符串是一系列的Unicode字符。 UTF-8是一系列'byte'值。 – Tomalak

回答

0

如果unicode中的文本,您可以执行一个编码操作来转换为utf-8。如果它已经在utf-8中,它将不会被双重编码。它只会抛出一个错误,说明:

AttributeError: 'bytes' object has no attribute 'encode