2016-03-02 47 views
0

我正在加载一些带有西班牙字符á,é,í...的twitters,并且显然它们存储良好,但是当我使用笔记本将它们加载到RDD中时python,这些字母被替换为\ xe1,\ xe9 ..等等。蟒蛇火花笔记本中的错误字符

实施例:

u'RT @rodriguezjoma:埃尔#petr \ xf3leoý#Repsol fracasan烯スintento德superar resistencias:https://t.co/EtmZynrxQGhttps://t.co/JQcG5gk4Cd”, u'Metele马克阙quiero版本一拉naranjita雷普索尔CON EL #1 este a \ xf1o !!!',

我能做些什么来获得正确的字符?

回答

0

您具有正确的字符,但unicode字符串的表示形式对ASCII范围外的字符使用转义序列。