我有一个按列插入时间进行分区的配置单元表。将pyspark数据框插入到现有的分区配置表hive表中
我有一个pyspark数据框,除了分区列以外,它有与表相同的列。
下效果很好,当该表未分区:
df.insertInto('tablename',overwrite=True)
但我无法从pyspark弄清楚如何插入到特定的分区
如下尝试:
df.insertInto('tablename',overwrite=True,partition(inserttime='20170818-0831'))
但它没有工作和失败
SyntaxError: non-keyword arg after keyword arg
,我使用pyspark 1.6