由于某种原因,我必须每行都有一个HTML标签。所以,如果下面是输入:每行一个html标签的正则表达式
<p><div class="class1 <%= "class3" %>class2">div content</div></p>
输出应该是:
<p>
<div class="class1 <%= "class3" %>class2">div content
</div>
</p>
正则表达式应该能够识别ERB脚本标记和HTML标记之间的差异。缩进不是必需的。
这怎么能通过正则表达式来完成?
请参阅:http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags –
正则表达式是错误的工具,您的示例代码是完美的那个例证。你的例子将打破几乎任何理智的正则表达式,并且随着你的发展,它会变得更加复杂。改用解析器。 –
我相信@Paul和@Justin提出的建议。正则表达式不适合这种类型的工作。 我正在考虑@ Kobi的答案是否正确,因为它提供了所提供示例的解决方案。 – intellidiot