我想通过使用php函数preg_split将字符串与文本拆分为单词。将字符串拆分为带有瑞典字符的字
$words = preg_split('/\W/u',$text);
它工作正常,除了瑞典字符liteåäö。做utf8_encode或解码也没有帮助。我的猜测是,preg_split只适用于单字节字符和瑞典字符是多字节。还有另一种方法可以做到吗?
我想通过使用php函数preg_split将字符串与文本拆分为单词。将字符串拆分为带有瑞典字符的字
$words = preg_split('/\W/u',$text);
它工作正常,除了瑞典字符liteåäö。做utf8_encode或解码也没有帮助。我的猜测是,preg_split只适用于单字节字符和瑞典字符是多字节。还有另一种方法可以做到吗?
你为什么要关注特定的人物?
$text = "Jag har hört så mycket om dig.";
$words = explode(" ", $text);
/*
Array
(
[0] => Jag
[1] => har
[2] => hört
[3] => så
[4] => mycket
[5] => om
[6] => dig.
)
*/
mb_split
救援(有这些问题我前一段时间,刚才找到了答案:)
mb_regex_encoding('UTF-8');
mb_split('\W', $text);
HTH
难道你想这样做在Perl呢?为什么perl标签在这里? – Ether 2010-01-18 22:32:34
啊,嘿嘿抱歉,但perl的人通常更好的正则表达式:) – Martin 2010-01-18 22:34:30