我相信另一个答案会拒绝一些有效的url(如大写或长子域名),并允许一些无效的(如http://www.-example-.com或www。%@ &.com)。我试图考虑一些额外的url语法规则(没有进入国际化)。
function isUrlValid(userInput) {
var regexQuery = "^(https?://)?(www\\.)?([-a-z0-9]{1,63}\\.)*?[a-z0-9][-a-z0-9]{0,61}[a-z0-9]\\.[a-z]{2,6}(/[-\\[email protected]\\+\\.~#\\?&/=%]*)?$";
var url = new RegExp(regexQuery,"i");
return url.test(userInput);
}
var input = ["https://o.sub-domain.example.com/foo/bar?foo=bar&boo=far#a%20b",
"HTTP://EX-AMPLE.COM",
"example.c",
"example-.com"];
for (var i in input) document.write(isUrlValid(input[i]) + ": " + input[i] + "<br>");
中,也允许IP地址和端口号,正则表达式是:
"^(https?://)?(((www\\.)?([-a-z0-9]{1,63}\\.)*?[a-z0-9][-a-z0-9]{0,61}[a-z0-9]\\.[a-z]{2,6})|((\\d{1,3}\\.){3}\\d{1,3}))(:\\d{2,4})?(/[-\\[email protected]\\+\\.~#\\?&/=%]*)?$"
中,也允许查询字符串没有域名和问号之间的斜线(这在理论上是不允许的,但在大多数现实生活中都可以使用),正则表达式是:
"^(https?://)?(((www\\.)?([-a-z0-9]{1,63}\\.)*?[a-z0-9][-a-z0-9]{0,61}[a-z0-9]\\.[a-z]{2,6})|((\\d{1,3}\\.){3}\\d{1,3}))(:\\d{2,4})?((/|\\?)[-\\[email protected]\\+\\.~#\\?&/=%]*)?$"
为了还确保每%后跟一个十六进制数,正则表达式是:
"^(https?://)?(((www\\.)?([-a-z0-9]{1,63}\\.)*?[a-z0-9][-a-z0-9]{0,61}[a-z0-9]\\.[a-z]{2,6})|((\\d{1,3}\\.){3}\\d{1,3}))(:\\d{2,4})?((/|\\?)(((%[0-9a-f]{2})|[-\\[email protected]\\+\\.~#\\?&/=])*))?$"
(注:如约翰·吴在评论中提到,有正当single-letter domains)。
来源
2015-06-22 01:39:04
m69
应该是'(http(s)?:\/\ /。)?(www \。)?[ - a-zA-Z0-9 @:%._ \ +〜#=] { 2,256} \。[az] {2,6} \ b([ - a-zA-Z0-9 @:%_ \ +。〜#?&=] *)'。在https://regex101.com/上检查上述正则表达式会给出错误。 – saruftw