我有一个需要删除标记内容的HTML代码。他们的人数约为30人。它是在HTML代码中的不同地方发现类似匹配字符串的第一次出现
<A class=tooltiplink href="javascript:void;" style="color:#000000"><img src="images/footnote.jpg" border="0"><SPAN style="margin:0 0 0 0px;"> unwanted info 4:6 </SPAN></A>
<b>Hello </b>
<A class=tooltiplink href="javascript:void;" style="color:#000000"><img src="images/footnote.jpg" border="0"><SPAN style="margin:0 0 0 0px;"> unwanted info 4:6 </SPAN>
</A><b>World</b>
<A class=tooltiplink href="javascript:void;" style="color:#000000"><img src="images/footnote.jpg" border="0"><SPAN style="margin:0 0 0 0px;"> unwanted info 4:6 </SPAN></A>
所需的输出:的Hello World
当我尝试删除标签内容为$_=~s/A(.+)?\/A//gs;
。它也占用了最后一个标签内的有用信息。除去g也有同样的效果。如何在没有第一个和最后一个匹配的情况下仅删除标签内容,并删除有用的信息。
你有一些例子输入和输出的要求? – chooban
我已经发布了示例代码。我只需要你好和世界。 – xtreak
需要一些信息来给出一个通用的穷举答案:1)我认为这只是更大的html代码的一部分,可能有几个例子像你的样本。 2)我们如何定义(作为分隔符)是否与对应于您的第一个. 3) unwanted info is the one between first peer 的分隔符相对应4)我们能否假定该块总是在多行上或者也可能在1行中(并且在这种情况下需要更正) – NeronLeVelu