我正在查看Spark SQL,Scala中的Spark DataFrame的窗口幻灯片函数。spark SQL窗口函数滞后
我有一个数据帧与列Col1,Col1,Col1,日期。
Col1 Col2 Col3 date volume new_col
201601 100.5
201602 120.6 100.5
201603 450.2 120.6
201604 200.7 450.2
201605 121.4 200.7`
现在我想添加一个名为new_col的新列,其中一行向下滑动,如上所示。
我试过下面的选项来使用窗口函数。
val windSldBrdrxNrx_df = df.withColumn("Prev_brand_rx", lag("Prev_brand_rx",1))
任何人都可以请帮助我如何做到这一点。
@Ramesh until Spark 2.0,用户不得不使用'HiveContext'而不是'SQLContext'来应用窗口函数。通过传递'SparkContext'的实例,''HiveContext'的创建方式与'SQLContext'相同。如果我没有记错的话,你还需要为你的Spark发行版加入'org.apache.spark:spark-hive_2.10'。 –
@msrinivas,谢谢你的回答是正确的。 – Ramesh