可能重复:
What is the best way to remove accents in a python unicode string?
Python and character normalization去除重音和特殊字符
我想去掉口音,把所有字符转换为小写,并删除任何数字和特殊字符。
例子:
Frédé[email protected] - >弗雷德里克
建议:
def remove_accents(data):
return ''.join(x for x in unicodedata.normalize('NFKD', data) if \
unicodedata.category(x)[0] == 'L').lower()
有没有什么更好的方法来做到这一点?
你能编辑你的答案,包括一些期望的输入和输出的例子吗? – 2012-01-01 18:56:22
@Christian JonassenFrédé[email protected] - > frederic @@àbcd - > abcd%*tréçd - > trecd – Fred 2012-01-01 19:00:20
我使用python 3.x – Fred 2012-01-01 19:24:15