我的数据帧输出保存为文本文件后删除列名是如下,
DF.show(2)
从火花数据帧,而把它作为文本文件
+--------------+
|col1|col2|col3|
+--------------+
| 10| 20| 30|
| 11| 21| 31|
+--------------+
- DF.rdd.saveAsTextFile(“路径”)
Row(col1=u'10', col2=u'20', col3=u'30')
Row(col1=u'11', col2=u'21', col3=u'31')
数据帧有数百万行和20列,我怎样才能将其保存为文本文件如下,即没有列名和Python统一码
10|20|30
11|21|31
在创建初始RDD我用下面的代码去除统一码,但仍然得到统一码,
data = sc.textFile("file.txt")
trans = data.map(lambda x: x.encode("ascii", "ignore").split("|"))
提前感谢!
谢谢@PeterK,这是为这个例子DF工作,但我的实际DF包含数百万行和20列,,,我怎么能为真正的DF做到这一点? – user491
对不起,我能够运行此为我的实际DF,而最初尝试时,我面临的问题 - SyntaxError:非ASCII字符'\ xe2'在文件中,这[链接](http://stackoverflow.com/questions/ 21639275/python-syntaxerror-non-ascii-character-xe2-in-file)帮助我 – user491
@ hadoop491如果您不想指定所有可以尝试的列: .map(lambda x:'|'.join(地图(STR,X))) –