SPARK SCALA中是否存在左外连接等价物?我明白有相当于数据库内部连接的连接操作。相当于SPARK中的左外连接
7
A
回答
15
Spark Scala确实支持左外连接。这里有一个看看 http://spark.apache.org/docs/latest/api/scala/index.html#org.apache.spark.api.java.JavaPairRDD
用法很简单,因为
rdd1.leftOuterJoin(rdd2)
3
是的,有。看看DStream APIs,他们提供了左外连接和右外连接。
如果你有型的流让我们说“记录”,你想加入的记录两个流,那么你就可以做到这一点,如:
var res: DStream[(Long, (Record, Option[Record]))] = left.leftOuterJoin(right)
随着API的说法,左,正确的流必须被散列分区。即,您可以从Record中获取一些属性(或以其他方式)来计算哈希值并将其转换为对DStream。在调用该加入函数之前,left
和right
流的类型将为DStream[(Long, Record)]
。 (这只是一个例子,Hash类型也可以是Long
以外的其他类型)。
5
这是因为rdd1.leftOuterJoin(rdd2)
一样简单,但你必须确保两个RDD的是(键,值)的每个元素的形式rdd的。
0
星火SQL /数据帧API还支持左/右/ FULL 外直接加入:
https://spark.apache.org/docs/latest/sql-programming-guide.html
由于这种错误的:在星火https://issues.apache.org/jira/browse/SPARK-11111外连接1.6之前可能会很慢(除非你有非常小的数据集才能加入)。它曾经使用笛卡尔积,然后在1.6之前过滤。现在它正在使用SortMergeJoin。
相关问题
- 1. 左外连接与左连接相同吗?
- 2. 左外连接和左连接相同吗?
- 3. 左外连接中的LINQ
- 4. 左外连接IEnumerable
- 5. 左外连接 - SQL2005
- 6. Linq左外连接
- 7. 左外连接SOQL
- 8. Python左()相当于?
- 9. 左外连接与相同的表作为外连接的一部分
- 10. NHibernate的左外连接
- 11. 真正的左外连接
- 12. MySQL的左外连接
- 13. 的Django 1.7左外连接
- 14. Grails的,左外连接
- 15. Spark 2.2空安全左外连接空指针异常
- 16. 空指针异常 - Apache Spark数据集左外连接
- 17. SQL左外连接vs内连接不等于
- 18. 内连接或左外连接基于条件
- 19. 左连接与全外连接组合
- 20. SQL左外连接与n:m连接表
- 21. 内有多个左外连接连接
- 22. t-sql中的左外连接
- 23. 左外连接中的最大日期
- 24. LinqToSql中的多个左外连接?
- 25. Linq左外连接中的多列
- 26. 使左外连接中的JavaScript
- 27. MySQL中的左外连接与SUBSELECT
- 28. mysql中的左外连接问题
- 29. 左外连接oracle中的三个表
- 30. 左外部连接问题
谢谢..如果你能给出一个代码示例将是有帮助的... – user3279189