hago已经提到要过滤不属于GBK的Unicode字符的评论,但我想给出一个使用MySQL Connector/Python的完整示例。
# -*- coding: utf-8 -*-
import mysql.connector
cnx = mysql.connector.connect(
database='test', charset='gbk', use_unicode=False
)
cur = cnx.cursor()
cur.execute("DROP TABLE IF EXISTS gbktest")
table = (
"CREATE TABLE gbktest ("
"id INT AUTO_INCREMENT KEY, "
"c1 VARCHAR(40)"
") CHARACTER SET 'gbk'"
)
cur.execute(table)
data = {
'c1': u'\u2022国家标准'.encode('gbk', 'ignore')
}
cur.execute("INSERT INTO gbktest (c1) VALUES (%(c1)s)", data)
cnx.commit()
cur.execute("SELECT id, c1 FROM gbktest")
rows = cur.fetchall()
# Terminal using UTF-8 encoding:
#print rows[0][1].decode('gbk')
# Terminal using GBK encoding:
print rows[0][1]
最后两行需要被注释/取消注释取决于您的终端是否使用UTF-8或GBK编码。
在提交给mysql库之前过滤这些字符,我猜。 – hago
我这么认为。谢谢! –