我有一个表单字段,允许多达120个字符,并且还接受所有UTF-8 Unicode字符集,包括特殊字符,数字字符和Alpha字符以提供国际字符。它应该忽略前导和尾随空格UTF-8字符集
由于我主要使用有限的ASCII集,我不确定UTF-8会包含什么。
请你指导一下ASCII/UTF-8的基本差异,以及在上述要求下应该允许的完整字符集。
谢谢。
我有一个表单字段,允许多达120个字符,并且还接受所有UTF-8 Unicode字符集,包括特殊字符,数字字符和Alpha字符以提供国际字符。它应该忽略前导和尾随空格UTF-8字符集
由于我主要使用有限的ASCII集,我不确定UTF-8会包含什么。
请你指导一下ASCII/UTF-8的基本差异,以及在上述要求下应该允许的完整字符集。
谢谢。
简而言之,UTF-8是US-ASCII的超集。 ASCII中的任何字符都可以用UTF-8表示,并使用相同的位表示。 UTF-8是Unicode的一种表示形式,它允许表示任何当前定义的字符。
ASCII只包含128个字符,最新版本的Unicode包含超过109,000个字符,覆盖93个脚本。
http://en.wikipedia.org/wiki/ASCII - 约ASCII
http://en.wikipedia.org/wiki/Unicode充分说明 - 有关Unicode
维基文章http://unicode.org/charts/ - Unicode的图表列表
Thx很多...既然charset是如此之大,是否有任何标准的方式来编写正则表达式来满足我在utf-8中需要的? – testndtv
你有没有读过这个吗? http://www.exelonsoftware.com/articles/Unicode.html – Mic