是否有可能使用纯Python代码制作自定义Python codec,其中该编解码器的字符可以多于一个常规str
或unicode
字符,就像在Python 2.x中的“unicode”编码中的方式,两个ASCII字符可以是一个Unicode字符? (因此,例如,如果'。'和'%。'分别为1个字符,则'.' in '%.'
将为假)具有不同长度字符的自定义Python字符串编解码器?
如果可能,是否有办法让编解码器与所有字符串方法一起正常工作? (所以,举例来说...
a = 'qwerty.uio%.p'.encode('aencoding')
a.split('.'.encode('aencoding'))
...会返回一个包含qwerty
和uio%.p
元组)
你也可以有一个使用一个字节来表示多个字符的编码。 – dan04 2011-03-07 14:32:51
非常真实,很好。 – samplebias 2011-03-07 14:34:38