2015-05-09 52 views
0

我想删除所有URL中的Google前缀。匹配url前缀的正则表达式

<a href="http://news.google.com/news/url?sa=t&fd=R&ct2=en&usg=YFo&url=http://www.goo.tv/gd/2015/0509/735557.html 

dfgdfgdfgdfgdf9 

<a href="http://news.google.com/news/url?sa=t&fd=R&ct2=en&usg=AFQjCNFUS_UVkd9L-r7g&clid=c3878e0698331&cid=5213281008&ei=5DFNVJ4eymQLmyYFo&url=http://www.goo.tv/gd/2015/0509/735557.html 

我想删除http://news.google.com/news/url?sa=t&fd=R&ct2=en&blalba....url= 这个谷歌的前缀,使其只保留真实的URL。

我想正则表达式,但它不会每个前缀匹配,这一切内容匹配 <a href="(http:\/\/news.google.com/news/url\?([\s\S]*)&url=)

回答

1

使用Lazy Quantifiers

<a href="(http:\/\/news.google.com\/news\/url\?([\s\S]*?)&url=) 

你的正则表达式没有工作,因为它是贪婪(*) ,并将比赛直到最后& url =找到。懒惰量词(*?)在找到的第一个匹配处停止,这是您的情况的预期行为。

+0

谢谢。真的有助于记录。从你那里学到了这些。有用! – Mark