1
A
回答
3
你可以使用
\w+
与Unicode的标志。我假设你的名字没有数字或下划线的风险。
>>> re.findall('\w+', 'Márquez', re.U)
['Márquez']
也似乎问号后失踪P
:(?P<name>[a-zA-Z]+)
0
对于Python < 3,你可能希望启用区域:
import locale
locale.setlocale(locale.LC_ALL, '')
然后用re.LOCALE
选项会regexpes :
re.findall('\w+', 'Márquez', re.LOCALE)
虽然,大概Unicode是更好的路要走,但它需要的数据进行解码和编码它到你的本地编码。
相关问题
- 1. 正则表达式字母数字字符串+特殊字母
- 2. 正则表达式字母数字和特殊字符的jQuery
- 3. 正则表达式的字母数字特殊字符
- 4. jQuery的字母数字(+特殊字符)正则表达式
- 5. 正则表达式特殊字符,数字和字母
- 6. 正则表达式与特殊字符
- 7. 大写字母,2个特殊字符的正则表达式
- 8. 正则表达式4个字母的特殊字符
- 9. 正则表达式的特殊字符
- 10. 特殊字符的正则表达式?
- 11. 特殊字符的正则表达式
- 12. 正则表达式的特殊字符
- 13. 在正则表达式中匹配特殊字符和字母
- 14. 正则表达式与特殊字符
- 15. 正则表达式特殊字符
- 16. JavaScript特殊字符/正则表达式
- 17. C#正则表达式,特殊字符
- 18. 正则表达式与特殊字符
- 19. PHP正则表达式特殊字符
- 20. 正则表达式特殊字符
- 21. 正则表达式和特殊字符
- 22. 正则表达式Python字符串忽略特殊字符
- 23. 正则表达式来验证字母数字和特定的特殊字符
- 24. 正则表达式接受字母或字母数字字符或带有特殊符号的字母字符
- 25. Mysql正则表达式与一些特殊字符的字母数字
- 26. C#匹配字母,数字和特殊字符的正则表达式
- 27. 包含字母数字和特殊字符的正则表达式
- 28. 用于字母数字和特殊字符的正则表达式
- 29. 正则表达式的字母,至少1个数字和特殊字符
- 30. 验证的正则表达式与字母数字和特殊字符
这并不好看的Python <3.0 - 我不喜欢使用与普通(非Unicode)字符串的UNICODE选项的想法。 – 2010-03-09 19:46:21
@Jacek:为什么你非ASCII字符串不是Unicode? – SilentGhost 2010-03-09 19:48:30
在Python 2.x的STR型和“XXXX”文字只包含一个字节的字符串。这些字节可能是特定编码中的某些字符,但是没有编码信息,这些字符只是字节。 '马尔克斯' 是:(77,195,161,114,113,117,101,122)(8个字节),如果您的编码是 'UTF-8' 或(77,225,114,113,117,101,122 )(7字节)如果编码是ISO 8859-1。当在ISO 8859-7中解码时,相同的值将是“Mαrquez”。相同的字节,不同的字符。不知道编码,我们不能谈论Unicode字符。 – 2010-03-09 20:30:47