我使用的查询,如下所示,以从MySQL获取数据:虚列火花JDBC
var df = spark.read.format("jdbc")
.option("url", "jdbc:mysql://10.0.0.192:3306/retail_db")
.option("driver" ,"com.mysql.jdbc.Driver")
.option("user", "retail_dba")
.option("password", "cloudera")
.option("dbtable", "orders")
.option("partitionColumn", "order_id")
.option("lowerBound", "1")
.option("upperBound", "68883")
.option("numPartitions", "4")
.load()
问题是,我可以使用伪柱(像ROWNUM
在Oracle或RRN(employeeno)
在DB2)与option
其中I指定partitionColumn
?
如果不是,我们可以指定一个不是主键的分区列吗?
@clear sky,请标记答案为已接受,如果它解决您的查询。 –
请更具体一点 - 它可以是伪列吗?例如,像Oracle ROWNUM? –
你有没有尝试在你的代码中使用ROWNUM而不是order_id? –