我收到具有值如XML饲料非UTF符号:UTF8编码与MySQLdb的上
<Theme>Valentine's Day</Theme>
<Copyright>© Ventures. All Rights Reserved.</Copyright>
我需要解析的值并将其存储在一个MySQL数据库。什么是最好的方法来清理的价值,所以我可以插入"Valentie's Day"
,"<copyright symbol> Ventures. All Rights Reserved."
?这里有大约20多种不同的标记。
做直INSERT
,我会得到以下埃罗:
Warning: Incorrect string value: '\xA9 1987...' for column 'title' at row 1
文件编码在这里是不相关的,它只影响如何解释字符串文字。 –