最近,我开始在我的Rails模型中使用来自JQuery validation插件的电子邮件验证正则表达式。正则表达式在Ruby中与JavaScript相比表现不佳
EMAIL_REGEXP=/^((([a-z]|\d|[!#\$%&'\*\+\-\/=\?\^_`{\|}~]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])+(\.([a-z]|\d|[!#\$%&'\*\+\-\/=\?\^_`{\|}~]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])+)*)|((\x22)((((\x20|\x09)*(\x0d\x0a))?(\x20|\x09)+)?(([\x01-\x08\x0b\x0c\x0e-\x1f\x7f]|\x21|[\x23-\x5b]|[\x5d-\x7e]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(\\([\x01-\x09\x0b\x0c\x0d-\x7f]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF]))))*(((\x20|\x09)*(\x0d\x0a))?(\x20|\x09)+)?(\x22)))@((([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])([a-z]|\d|-|\.|_|~|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])*([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])))\.)+(([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])([a-z]|\d|-|\.|_|~|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])*([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])))$/i
"[email protected]".match EMAIL_REGEXP # returns immidiately
"[email protected]".match EMAIL_REGEXP # takes a long time
正则表达式采用当一个无效电子邮件已经许多圆点分隔的标记长的时间(延续:[email protected])。同样的表达works without JavaScript中任何明显的延迟。
为什么Ruby和JavaScript正则表达式解析器在性能上有这样的差异?有什么我可以做的,以提高响应时间?
我在Ruby 1.8.7上。我在Ruby 1.9.2上看不到相同的问题。
注意
我知道REG-EXP长。由于它被jQuery使用,我想过使用它。我可以随时将其更改回更简单的正则表达式,如here所示。我的问题主要是找出为什么同样的正则表达式在JS中快得多的原因。
参考:
JQuery Validation Plugin Source
Sample form with jQuery email validation
这是一个巨大的正则表达式。你为什么不使用电子邮件解析器? – Blender
@如果你提供了一个链接,Blender的评论质量会大大提高 – tekknolagi
这个正则表达式来自官方的'jQuery'插件,它被广泛使用。所以我认为这是一条安全的路线。如果我无法使RegExp正常工作,我可能会走自定义验证的路线。 –