grapheme

4热度

1回答

一般斯威夫特是真的智能计数字形集群作为一个单一的字符。如果我想打一个黎巴嫩国旗，例如，我可以将两者结合起来的Unicode字符 U + 1F1F1区域指标符号字母L U + 1F1E7区域指标符号字母B 并预期这是斯威夫特一个字符： let s = "\u{1f1f1}\u{1f1e7}" assert(s.characters.count == 1) assert(s.utf16.count

2热度

1回答

给定一个Unicode代码点列表，如何将它们拆分为一个Unicode字符列表？

我正在为Unicode文本编写一个词法分析器。许多Unicode字符需要多个代码点（即使在规范组合之后）。例如，tuple(map(ord, unicodedata.normalize('NFC', 'ā́')))评估为(257, 769)。我怎么知道两个角色之间的界限？另外，我想存储文本的非标准化版本。我的输入保证是Unicode。到目前为止，这是我所： from unicodedata im

1热度

4回答

分割Unicode的实体由字形

"d̪".chars.to_a 给我 ["d"," ̪"] 如何获得红宝石由字形分割呢？ ["d̪"]

0热度

1回答

字形š始终是大胆的

我与小时以来的字体风格战斗。我使用谷歌webfont的“open sans”，并测试了Google上的Google字形审查选项。一切都很好，š像其他字体一样薄而美丽。（抱歉，我不能张贴图像）但在我的网站š总是大胆！我重新设计了所有样式表以确保没有任何内容覆盖字体重量或其他内容。我的文档是utf-8，我试图左右逢源发布字形：S和š 我扫描谷歌quellcode找到魔正确显示字形

3热度

1回答

如何计算字形集群或“知觉”在Java中

表情符我期待计数中，提供的Java字符串察觉的表情符号字符数。我目前使用的emoji4j库，但它并不适用于字形集群像这样的工作：调用EmojiUtil.getLength("‍‍‍")回报4代替1，同样叫EmojiUtil.getLength("‍‍‍")回报5代替2。是否有在Java中，可以很容易计算字形集群上String任何API或方法？我一直在四处打猎，但是可以理解的是String上的

1热度

1回答

一组不同的字形是无限的吗？

可以使用Unicode编码（如UTF-8）表示的不同字形的数量是否有限制？例如，Unicode标准是否限制连续组合字符的数量？

4热度

3回答

在JavaScript字符串中获取字符字符数？

我试图在用户可见的字形中获取JavaScript字符串的长度，即忽略组合字符（和代理对？）。这是否可能，如果是的话，我会怎么做呢？我们在我们的项目中使用dojo工具包，但任何一般的javascript解决方案都会很棒。