我需要用波兰语字符替换字符串。使用波兰语字符时的不兼容
我尝试下面的代码:
k = 'aąkkk cdkkk aą xskkk'
odp = re.sub('(?<!aą|cd)kkk', '***', k)
print (odp)
但不幸的是它产生以下错误:因为当我更换了与“A”字
File "/usr/lib/python2.7/re.py", line 244, in _compile raise error, v # invalid expression
问题是与润色人物 'a'char它工作正常:
k = 'aąkkk cdkkk aą xskkk'
odp = re.sub('(?<!aa|cd)kkk', '***', k)
print (odp)
答案是:aą*** cdkkk aą xs***
我尝试使用UNICODE,但它仍然不能正常工作:
a = re.compile(ur'(?<!\u0061\u0105|\u0063\u0064)kkk', re.UNICODE)
a
k = u'aąkkk cdkkk aą xskkk'
odp = a.sub('***', k)
print (odp)
答案上面是:aÄ*** cdkkk aÄ xs***
我怎样才能解决这个问题?
你是否在脚本的开头设置了'coding:'?结果看起来像您需要在您的终端中启用UTF-8支持。 – tripleee