2011-07-15 40 views
-1

我碰到此代码,我在无所适从u意味着:你在正则表达式中的含义是什么?

$todecode =~ s{ 
    %u([Dd][89a-bA-B][0-9a-fA-F]{2}) # hi 
      %u([Dd][c-fC-F][0-9a-fA-F]{2}) # lo 
     }{ 
    utf8_chr(
     0x10000_ 
     + (hex($1) - 0xD800) * 0x400_ 
     + (hex($2) - 0xDC00) 
    ) 
     }gex; 

回答

14

这是tv之间的信件。 (它匹配文字u。)

它看起来像有人有一些文字与UTF-16写出为%uD800%uDC00代理对,他们正在通过解码码点至utf8_chr功能,而代的是结果。

相关问题