使用python从sqlite db读取unicode

存储在unicode（在数据库中）的数据必须被检索并转换为不同的形式。使用python从sqlite db读取unicode

下面的代码片断

def convert(content): 
    content = content.replace("ஜௌ", "n\[s"); 
    return content; 

mydatabase = "database.db" 
connection = sqlite3.connect(mydatabase) 
cursor = connection.cursor() 
query = ''' select unicode_data from table1''' 
cursor.execute(query) 
for row in cursor.fetchone(): 
    print convert(row)

产生在转换方法下面的错误消息。

exceptions.UnicodeDecodeError: 'ascii' codec can't decode byte 0xe0 in position 0: ordinal not in range(128)

如果数据库内容为“ஜௌஜௌஜௌ”，输出应该是“N \ [SN \ [SN \ [秒”

的文档建议使用忽略或替换，以避免错误，当创建unicode字符串。

时，按如下迭代变化：

for row in cursor.fetchone(): 
    print convert(unicode(row, errors='replace'))

exceptions.TypeError: decoding Unicode is not supported

其告知该行已经是一个unicode。

任何光线都可以使它工作，我们非常感谢。提前致谢。

来源

2012-02-05 Gopal

什么版本的Python你正在用吗？ – fuzzyanalysis 2012-02-05 10:18:37

其python 2.6.3。 – Gopal 2012-02-05 10:52:19

尝试在您的python脚本中使用'u“例子”'输入unicode字符串。这很刺激，但Python 2有两种类型的字符串，“unicode”和“str”。不确定技术方面，例如，这些可能是8位（例如使用UTF-8编码）和16位字符串。另外，你可能想要'\\ ['？ – 2012-02-05 11:41:02

content = content.replace("ஜௌ", "n\[s");

建议你的意思是：

content = content.replace(u'ஜௌ', ur'n\[s');

或安全在您的文件的编码是不确定的：

content = content.replace(u'\u0B9C\u0BCC', ur'n\[s');

你拥有的内容已经是Unicode的，所以你应该做的Unicode字符串替换它。 "ஜௌ"没有u是一个字节字符串，它表示在某些编码中这些字符依赖于源文件字符集。（字节串顺利只有在最明确的情况下，与Unicode字符串一起工作，这是ASCII字符）。

（该r -string意味着不必担心，包括裸反斜线。）

来源

2012-02-05 11:49:45 bobince

感谢bobince，它像魅力一样工作。 – Gopal 2012-02-05 14:34:00

使用python从sqlite db读取unicode

回答

相关问题