1
我在HDFS中有2个文件 - 一个是没有标题的csv文件,一个是列名称列表。我想知道是否可以将列名分配给其他数据框,而不需要像描述的here那样输入它们。Spark重命名数据框列
我正在寻找这样的事情:
val df = sqlContext.read.format("com.databricks.spark.csv").option("delimiter", "\t").load("/user/training_data.txt")
val header = sqlContext.read.format("com.databricks.spark.csv").option("delimiter", ",").load("/user/col_names.txt")
df.columns(header)
这可能吗?