我已经切换了Python 3.6现在,但是当运行内容丰富的功能时,我试图在我的特征提取器中打印俄罗斯时,结束了胡言乱语。内容丰富的功能不返回西里尔字符
Most Informative Features
three_last_letters = 'оÌ' noun : verb = 6.6 : 1.0
three_last_letters = 'гÐ' noun : verb = 5.4 : 1.0
three_last_letters = 'еÐ' noun : verb = 4.7 : 1.0
three_last_letters = 'мÐ' noun : verb = 4.4 : 1.0
three_last_letters = 'нÑ' noun : verb = 3.5 : 1.0
在特征提取本身
def POS_features(word):
return{'three_last_letters':word[-3:]}
print(POS_features(u'Богатир'))
我能得到тир打印就好了的情况下,是有什么我可以做,以使信息量大的特点返回俄语字符?
关于什么操作系统?并且你是否在控制台或IDE中尝试打印? – dima
我在Windows上的Jupyter笔记本上编码。 – reivermello
如果Python 3.5没有这种情况,那可能是因为这种改变:“PEP 528和PEP 529,Windows文件系统和控制台编码更改为UTF-8”。对不起,没有合适的解决方案,但尝试尝试'sys.setdefaultencoding'并检查'sys.stdout.encoding'。 – drdaeman