从csv读取unicode字符时遇到问题。 CSV文件原本Unicode的标签要素:从CSV读取Unicode
"[u'Aeron\xe1utica']"
"[u'Ni\u0161']"
"[u'K\xfcnste']"
...
从中我不得不删除U '' 标签给一个CSV与
Aeron\xe1utica
Ni\u0161
K\xfcnste
....
现在我想读的CSV和输出入与字符的文件,即
Aeronáutica
Niš
Künste
....
我试图在csv docs使用UnicodeWriter,但它给人的输出作为第二列表
这里同样是我所做的读写:
c = open('foo.csv','r')
r = csv.reader(c)
for row in reader:
p = p + row
#The elements in p were ['Aeron\\xe1utica', 'Ni\\u0161', 'K\\xfcnste'...]
c = open('bar.csv','w')
c.write(codecs.BOM_UTF8)
writer = UnicodeWriter(c)
for row in p:
writer.writerow([row])
我也试过codecs.open ('','','UTF-8'),但它没有帮助
不,你*不*需要删除'u'。这些是Unicode值,你*想*统一码值。 –
当读取带有编码字符的CSV时,为什么不使用'UnicodeReader'? –
澄清:是否[u'Aeron \ xe1utica']是文件中的文字 - 如果不是 - 是什么? –