2012-11-09 49 views
2

我最近听说在网站上使用UTF-8(或Unicode)字符集时,不再需要对HTML特殊字符进行编码。使用UTF-8时,我应该对HTML特殊字符进行编码吗?

我的意思是非ASCII字符,如«(& laquo;), - (& mdash;)和类似字符。在HTML中保留的字符当然应该被转义(>,“等)。

如果是这样,准备在网上发布的大文本比以前容易得多。

+0

这是Unicode本身的主要优点之一。 –

+0

这当然是对的。只需要映像,您就必须对UTF-8提供的所有非ASCII字符进行编码......这将是相当多的... – arkascha

回答

5

在浏览器首次支持UTF-8时,从未要求使用UTF-8编码字符(使用字符引用(如&#8212;或实体引用如&mdash;)转义它们)。唯一的例外是小于号字符“<”和和号“&”,它们需要独立于编码而被转义。 (那么,引号不能用于带有与分隔符相同标记的引用属性值中,但这通常可以避免。)

可能仍然使用转义符号。如果您希望自己或其他人不得不编辑HTML文档,以免创作工具没有适当的UTF-8支持,则可以这样做。你也可以这样做,因为你正在输入文本,没有方便的插入所有字符的工具。但这些都是例外。

1

的确如此。

自从UTF-8接手以来,使用HTML实体(特殊字符除外)已经非常流行。

相关问题