下面发布的正则表达式用于拾取URL,包括格式为example.com
等格式的URL。不过,我希望它只能在前面有www.
或http
,https
等的网址中找到。换句话说,它应该拿起www.example.com
。它不应该拿起example.com
。URL的正则表达式
((((ht|f)tp(s?))\://)?((www.|[a-zA-Z])([a-zA-Z0-9\-]+\.)([a-zA-Z]{2,8}))(\:[0-9]+)*(/($|[a-zA-Z0-9\.\,\;\?\'\\\+&%\$#\=~_\-]+))*)
那么它工作还是什么? – danben 2010-01-20 16:00:33
您确定只想匹配美国域名吗?其他国家在TLD部分有一个额外的网址:www.bbc.co.uk或www.tmnet.com.my。 – slebetman 2010-01-20 16:17:10
此表达式已适用于提取包含子域名的网址。这是行不通的,因为我希望它只拾取以www开头的URL。或http: 菲利普G已经解决了这个问题,所以他更新的表达是最适合我的。 – Mike 2010-01-20 16:24:58