正则表达式中除去连续的字符格式标记

我需要一个正则表达式匹配和替换连续的字符格式标签封装在简单的DOM HTML解析器正则表达式中除去连续的字符格式标记

输入整段的标签：

<p><b><i>Lorem Ipsum Content</i></b></p>

预期输出：Lorem Ipsum

在下面的例子中，正则表达式只能匹配并替换标签，因为这是包含整个段落标签的唯一标签

例如：输入：Text some more text text inside 

输出：Text some more text text inside 

感谢。

2017-03-28 Abdul

它会是这个样子：

foreach($html->find('p') as $p) { 
    while(preg_match('/^<([^>]+)>(.*)<\/\1>$/', $p->innertext, $m)){ 
    $p->innertext = $m[2]; 
    } 
}

注意的是，在正则表达式的\1 HTML标记名称从匹配第一捕获组，可能不是必要的，但我为奖金做了。

2017-03-29 00:33:25 pguardiario

非常感谢@pguardiario – Abdul

不是一个优雅，也许是部分灵魂。

而步骤3的正则表达式就是这样。

<p>\s*(<i>)*\s*.*(<\/i>)\s*<\/p>

对于标签，更换到等

2017-03-28 07:39:53

回答