我想在C++中学习unicode处理。我将使用UTF-8
作为编码,但我的问题与编码无关。有效的Unicode字符串
问题很简单:是否有任何代码序列指向一个有效的unicode字符串?
我之所以问这个问题是因为A可被表示为U+00C5
或2个编码点U+0041
(A),U+030A
(以上环)的序列。这让我想知道一个代码点U+030A
(上面的环)的序列是否是一个有效的unicode字符串。事实证明,我已经能够在Linux下创建一个具有该名称的文件名,但我不确定它是否是一个有效的Unicode字符串。
这不是一个真正的C++特定问题,对吧? – Rakete1111
Rakete1111:你说得对。我已经删除了C++标记。 – InsideLoop
我的建议是根本不处理Unicode,而是使用库。 –