php
  • regex
  • 2011-08-26 49 views 0 likes 
    0

    我在包含度符号的字符串上preg_match_all时遇到问题。代码示例如下。遇到preg_match_all和度符号问题

    //Sample data 
    $x = "<array_0> 
         <id>text-21650</id> 
         <text>Lat/Long 38° 57' 34 N, 106° 21' 38 W</text> 
         </array_0>"; 
    
    $reels = '/<(\w+)\s*([^\/>]*)\s*(?:\/>|>(.*)<\/\s*\\1\s*>)/s'; 
    
    preg_match_all($reels, $x, $elements); 
    
    foreach ($elements[1] as $ie => $xx) { 
        $name = $elements[1][$ie]; 
        $cdend = strpos($elements[3][$ie], "<"); 
        if ($cdend > 0) { 
        $xmlary[$name] = substr($elements[3][$ie], 0, $cdend - 1); 
        } 
    
        if (preg_match($reels, $elements[3][$ie])) 
        $xmlary[$name] = processEl($elements[3][$ie]); 
        else if ($elements[3][$ie] !== null) { 
        $xmlary[$name] = $elements[3][$ie]; 
        } 
    } 
    

    由于某种原因,它无法正常使用度数符号。如果我把它拿出来就行了。我真的很想找到一种方式,让他们不用改变就能留在那里。我也想知道是否可能有其他可能导致问题的延伸角色。

    任何帮助将不胜感激。 谢谢

    +2

    “出于某种原因,它不能正常工作” - >这是什么意思?预期的行为和实际产出是什么? – JRL

    +2

    免费的建议...使用XML解析器,而不是用于解析XML的正则表达式。 – sberry

    +0

    [preg_match坐标与度符号]可能的重复(http://stackoverflow.com/questions/5355874/preg-match-coordinates-with-degree-sign) –

    回答

    3

    看看this previous answer on StackOverflow。基本上,你将不得不切换到Unicode匹配。

    改为使用mb_ereg_match来支持UTF-8字符。文档: http://php.net/manual/en/book.mbstring.php

    初始化MB *是这样的:

    mb_regex_encoding( 'UTF-8'); mb_internal_encoding( 'UTF-8');

    3

    我有同样的问题,this other post from stackoverflow帮助了我。基本上,为了寻找学位符号,你会使用\ x {00B0},即。

    preg_match_all(“/ \ xBB} /”,$ x,$ elements);

    相关问题