1
我正在为UTF-8编码的XML文件编写XSD,它可能包含许多非ASCII英文的语言。使用XML Schema验证语言
有没有可能的方法来验证只有某些语言(特别是不使用英文字母,如希伯来语或阿拉伯语的语言)才能通过验证?
我正在为UTF-8编码的XML文件编写XSD,它可能包含许多非ASCII英文的语言。使用XML Schema验证语言
有没有可能的方法来验证只有某些语言(特别是不使用英文字母,如希伯来语或阿拉伯语的语言)才能通过验证?
您可以使用正则表达式的模式方面来控制哪些字符集可能会出现,例如
<xs:pattern value="\p{IsHebrew}*"/>
,但我不知道你将如何利用这一点在实践中:大多数语言中允许使用外国脚本例如当提到外国人的名字时。
请注意区分字符集与编码。他们是完全不同的概念。像这样的图案面说明可能出现的字符,它不限制它们如何被编码。