2017-02-07 118 views
1

我有一个混合类型的数据框。 我正在使用 spark.sql('select a,b,c from table')命令从配置单元表中读取此数据帧。如何将数据帧的所有列转换为字符串

某些列是int,bigint,double等字符串。共有32列。 pyspark有没有办法将数据框中的所有列转换为字符串类型?

回答

7

刚:

from pyspark.sql.functions import col 

table = spark.sql("table") 

table.select([col(c).cast("string") for c in table.columns]) 
相关问题