2017-05-29 95 views
-1

我想在C++中学习unicode处理。我将使用UTF-8作为编码,但我的问题与编码无关。有效的Unicode字符串

问题很简单:是否有任何代码序列指向一个有效的unicode字符串?

我之所以问这个问题是因为A可被表示为U+00C5或2个编码点U+0041(A),U+030A(以上环)的序列。这让我想知道一个代码点U+030A(上面的环)的序列是否是一个有效的unicode字符串。事实证明,我已经能够在Linux下创建一个具有该名称的文件名,但我不确定它是否是一个有效的Unicode字符串。

+0

这不是一个真正的C++特定问题,对吧? – Rakete1111

+0

Rakete1111:你说得对。我已经删除了C++标记。 – InsideLoop

+0

我的建议是根本不处理Unicode,而是使用库。 –

回答

0

这使我怀疑一个码点U+030A(上环 ),没有收到任何的序列,是一个有效的Unicode字符串

问题是无效的,因为U+030A不是一个字符串,但一个代码点。但是,是的,假设您将此代码点正确编码为相关编码,如果此代码点单独出现,则不存在任何问题。它不需要任何东西。

事实证明,我已经能够Linux的

下创建的文件名与该名 这并不意味着蹲下。

+0

David Haim :我的问题是关于包含一个unicode点的unicode字符串,而不是unicode点。感谢您的回答。 – InsideLoop