解析网页时,我的解析器停止由于无效的DOM结构。我想通过替换某个节点来修复它。preg_replace如果条件匹配
我发现有一个额外的</div>
导致解析器停止。
我需要编写一个正则表达式,其将检查: 如果随后是</div>
[即任何</div>
没有起始<div>
之间的标记。它将检查<div
,因为该标签可能有id或class to follow],那么最后的</div>
将被替换为<div></div>
。
即,如果</div>
后面跟着</div>
,则最后一个将被替换为<div></div>
。
在此先感谢。
例如: <div> <img src="/lexus-share/images/spacer.gif" width="2" height="15" border="0" alt=""> </div> <a href="http://www.somedomain.com"><img src="/pub-share/images.jpg"></a> </div>
你可以A:提供一些代码与你的尝试和B:澄清你到底想要什么? – christopher 2013-02-26 13:30:09
也许你可以编辑它到你的问题:) – christopher 2013-02-26 13:35:46
所以你想要检查每个'