我正在写一个来自巴西页面的刮码,并且我正在将结果写入一个文件,结果是我从代码中得到的结果在ASCII中不受支持,并且给了我这个错误:有没有办法转换为unicode文件中的文本?在Python
File "testUnicode.py", line 6 SyntaxError: Non-ASCII character '\xc3' in file testUnicode.py on line 6, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details
,所以我找到了答案这里解决这个错误:
file.write(news.encode('uft8'))
和它的工作,因为它把我关了错误,但事情是,我仍然得到一个坏的方式的信息,像这样:
Em tom de desabafo, peemedebista diz que, no 1º mandato, foi um 'vice decorativo' Coalizão diz que usará sua maioria na Assembleia para libertar antichavistas Segundo autoridades, casal acusado das mortes estava 'radicalizado havia algum tempo' Entre as mulheres, Ãndice vai a 52%; maioria da população aprova movimentos feministas Manifestantes bloqueiam ruas contra a reorganização das escolas; houve discussão com motoristas Animalzinho é menor que um grão de gergelim
有没有办法解决这个问题?
你需要知道原始文本是什么编码。 – BrenBarn
我不认为它是'utf-8'.Use正确的编码 – vks