2010-01-18 82 views
3

我想通过使用php函数preg_split将字符串与文本拆分为单词。将字符串拆分为带有瑞典字符的字

$words = preg_split('/\W/u',$text); 

它工作正常,除了瑞典字符liteåäö。做utf8_encode或解码也没有帮助。我的猜测是,preg_split只适用于单字节字符和瑞典字符是多字节。还有另一种方法可以做到吗?

+0

难道你想这样做在Perl呢?为什么perl标签在这里? – Ether 2010-01-18 22:32:34

+0

啊,嘿嘿抱歉,但perl的人通常更好的正则表达式:) – Martin 2010-01-18 22:34:30

回答

3

你为什么要关注特定的人物?

$text = "Jag har hört så mycket om dig."; 
$words = explode(" ", $text); 
/* 
Array 
(
    [0] => Jag 
    [1] => har 
    [2] => hört 
    [3] => så 
    [4] => mycket 
    [5] => om 
    [6] => dig. 
) 
*/ 
+0

啊,我认为原因是我想分裂任何不是 - ö。但是,也许我可以循环访问数组并在之后执行该操作? – Martin 2010-01-18 22:31:10

+1

Dettaärdeträttasvaret。 – Ether 2010-01-18 22:31:17

1

mb_split救援(有这些问题我前一段时间,刚才找到了答案:)

mb_regex_encoding('UTF-8'); 
mb_split('\W', $text); 

HTH

相关问题