2016-07-05 56 views
1

在python3中,有没有办法找到给定的UTF代码是否包含任何非英文字符?提供的是一个字节码,我使用下面的行将其转换为UTF。python3检测unicode非英语?

line = line.decode("UTF-8") 

转换后,我想检测此行是否包含任何非英语(非ascii)字符。

+3

大量非ASCII字符在英文中有效,并且一些非英语语言使用ASCII,如果包含音译,则更多。 –

+0

^是的。我认为最好的例子是来自文字处理器的任何英文文本或者类似的东西都会包含由“智能报价”功能生成的倾斜引号/撇号,而这些都是非ASCII。 – sudo

+0

更不用说“naïve”和“résumé”等词语了。 –

回答