2014-01-19 62 views
1

我正在为UTF-8编码的XML文件编写XSD,它可能包含许多非ASCII英文的语言。使用XML Schema验证语言

有没有可能的方法来验证只有某些语言(特别是不使用英文字母,如希伯来语或阿拉伯语的语言)才能通过验证?

回答

1

您可以使用正则表达式的模式方面来控制哪些字符集可能会出现,例如

<xs:pattern value="\p{IsHebrew}*"/> 

,但我不知道你将如何利用这一点在实践中:大多数语言中允许使用外国脚本例如当提到外国人的名字时。

请注意区分字符集与编码。他们是完全不同的概念。像这样的图案面说明可能出现的字符,它不限制它们如何被编码。