我有这样的代码:如何在非ASCII字符串中使用正则表达式?
opendir(DIR, ".");
while (readdir DIR) {
print $1, "\n" if $_ =~ /(\w+)/i;
}
它当然是唯一的ASCII字符串。如何使用regexp在输出中获得另一个非ASCII字符串?
UPD
例如,如果在 “”。目录中有两个文件file
和другойфайл
。所以,当我运行此脚本我在输出中只得到file
但我想获得其他文件使用非英文名称другойфайл
当然,什么?为什么它只能得到ASCII字符串? – bmargulies 2013-02-12 22:49:41
'\ w +'是字母数字字符。你可以用'\ W +'来取消字符类。 – TLP 2013-02-12 22:54:42
那么我想解析的不仅仅是英文文件的名称。我在UPD中写过关于它的内容。 – edem 2013-02-12 23:08:36