2013-11-29 140 views
0

的价值我有看起来像这样的链接负载:正则表达式的HTML属性

 <A HREF="http://www.taboola.com/" ADD_DATE="1385139696" ICON="data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAABAAAAAQCAYAAAAf8/9hAAACx0lEQVQ4jXWTTWhdZRCGn5nvu+ee5CaxiTGtqUaKiJjYRRFNukhBIgUlCzeuFCy0lZaCUCiuBI8LQXcWRURFUXAjbq0i3fgTaFGktaVmowuRGhqsNya59557zjfjIkosxHc18MAsnplX2I7AJ7o1XnMoHPBtVghMyw4MoFB2TKHg8v8MtuHM2alsfOghsFws3CyXf11itdgAYKwYyWfuetiwXeZxrb764/e0X28DKgDNQ++eamTNlyWE2wkZ1B3MwrXNtc7TUA22bhv5QNXuI+RC6pFMfi675fNp6fg5Ye6dx4eG83MawOp6VdBl9/qgZgPRqv4K7lGz5rhV3b4QL5un6dDIW1ZXGxtrm/PazPWoCm5GKsv6hfXzRw7VST7EJYnYhCijuFtV+dn180fmyiq96p5MQhhqNuMzqrGxFxy3qq666fI/4r5BJAA1buaG1CZfURQEkYuYieAWGuxTr+q/UHGRRiCGPVCYO9M4vuVYEFVikLspCjO3SSSAI2a0g0wuZiFvPqkkCSoPxn2LMzGGZ0V80JI7IlEEFH8gm3pit8Z4LCjjjkjZqV4K9tv6Fd87MxqygdnQHNwTmyOzojKYzDu9bv9oEi6EkB3WbGBMB0fnVeMd7iplr/9avXT8LQECkJh7fzbP02Nissvxdq/b/4zvTl0CiAffXmhketiRYdz/6PXTF1w4uQSIAJI9+tErkbrX6fQ/5eKJZcB2/r4zLWbv3z8wkj2VyvKH/tfPfRwB1+CPZK2JBQ03XvSF91ZdGr8grIh7BwwnDIFPiqV7Nei4tiakX10/DRAB6uRf1t32AYn5WNAwCT65dQHH3QFFZKs9bjX15s3rnvzKrV048OY9zeGBxdiI8yK2H6/HQXLAEN109IYnu1Ql+7ZaXf+cn07/DmT/LpBb6rn7TIupO8fQxjApJnp/trm60oY3yv8IEYC/AVWrRrXbUwqeAAAAAElFTkSuQmCC">Taboola - Content you may like</A> 

我想删除整个ICONADD_DATE属性和值。

我使用的崇高与正则表达式查找/替换,但我不知道如何写正则表达式抢在ICON=""之间

任何帮助,将不胜感激一切!

+0

要获取ICON的属性,只需使用以下REGEX,'ICON = \“(。*)”'这将把变量间的所有字符置于引号之间 – spacebiker

+1

@Xabier:只有在没有其他引用标记... – Ryan

+1

@Xabier这将抓住所有的文字,直到最后的“ – Christophe

回答

0

这应该工作(如必要转义引号):

ICON="[^"]*" 

原因ICON=\"(.*)"将无法​​正常工作是正则表达式可以“贪心”在什么需要。这意味着,如果它可以匹配更多的字符串以满足图案它会。

您可以指定非贪婪的搜索,如ICON=".*?"或明确对不报价在上面的回答原子宣布比赛。