2016-11-22 64 views

回答

0

首先将初始记录存储到如下所示的配置单元表中。

sparkSession.read.parquet( “parquetFilePath”)write.saveAsTable( “someHiveTable”)

创建新记录数据帧

VAL newData:数据集[行] = //与新记录

使用数据帧中的任意下面的方法来追加记录

一)newData.insert入( “someHiveTable”)

B)newData.write.option( “模式”, “附加”)。saveAsTable( “someHiveTable”)

+0

它会更新或附加我目前的parquet文件吗?或者像我们在cassandra中所做的那样,当我们追加它时会匹配主键并覆盖那些已经存在的记录。 – Arslan