我正在寻找一个正则表达式来提取不包含HTML的所有相邻行块标记,但它们可以包含HTML 内联标记。正则表达式提取不包含HTML块标记的行
举例来说,如果我有以下的文字...
bla bla bla bla
bla <code>bla bla</code> bla
bla bla bla bla
<img src="" alt="" />
bla bla bla bla
<div> bla bla bla
bla bla bla
...我想只提取以下各行...
bla bla bla bla
bla <code>bla bla</code> bla
bla bla bla bla
<img src="" alt="" />
bla bla bla bla
这是可以做到的正则表达式?
更新:我正在使用PHP,我也有一个包含这些块标签名称的变量。 块标签是开放标签还是关闭标签无关紧要。
$blockTags = "h1|h2|h3|h4|h5|h6|hr|ol|ul|li|pre|blockquote|p|table|tr|td|div";
使用正则表达式,一切皆有可能。 :) – cakeforcerberus 2009-07-25 22:53:51
@semirhage:哦,我希望我现在能够冷静点评。 – Sean 2009-07-25 22:54:54
听起来像达斯Eru没有幽默感。 – 2009-07-25 22:57:51