在一些示例代码中,SparkSession实例被设置为singleton。 这是否意味着应该只有一个SparkSession实例? 如果有多个SparkSession会发生什么?他们可以(SparkSessions)互相交流吗?Spark - SparkSession应该只有一个吗?
1
A
回答
2
每个JVM只能有一个SparkSession(和SparkContext)实例。您将无法创建多个会话实例。
1
SparkSession对象是一个Singleton,因此每个客户端只有一个。
你可以自己打开一个SparkShell容易验证这一点:
斯卡拉> spark.toString
res7:字符串= [email protected]
import org.apache.spark.sql.SparkSession
scala>:paste //输入 粘贴模式(ctrl-D完成)
VAL火花= SparkSession .builder()
.appName( “SparkSessionZipsExample”).getOrCreate()//退出粘贴模式,现在解释。
17/02/06 07:25:48警告SparkSession $ Builder:使用现有的 SparkSession,某些配置可能无法生效。火花: org.apache.spark.sql.SparkSession = [email protected]
阶>:糊//进入粘贴模式(CTRL-d来完成)
VAL spark = SparkSession .builder()
.appName(“SparkSessionZipsExample”).getOrCreate()//退出粘贴模式,现在解释。
17/02/06 07:25:40警告SparkSession $ Builder:使用现有的 SparkSession,某些配置可能不会生效。火花: org.apache.spark.sql.SparkSession = [email protected]
正如你可以在这三种情况下,我们又回到了同一个对象@ d76a6bd
看相关问题
- 1. 每个应用程序应该只有一个EventSource对象吗?
- 2. 应该只有一个组件拥有状态吗?
- 3. MVVM模式中应该只有一个ViewModel类吗?
- 4. 即使只有一个块,chunking.success.endpoint应该被调用吗?
- 5. java包应该只有一个公共类吗?
- 6. ProducerTemplate应该只有一个实例
- 7. 树应该只有一个根节点
- 8. 我还应该创建一个类吗?如果它只能有一个实例?
- 9. 应该只有一列的表有主键吗?
- 10. pyspark error:AttributeError:'SparkSession'对象没有属性'parallelize'
- 11. 从SparkSession访问HiveConf
- 12. 一个集合应该只包含不可变元素吗?
- 13. 如果我只想要一个库,应该在application_controller中吗?
- 14. 从SparkSession获取JavaSparkContext
- 15. 'SparkSession'对象没有属性'sparkContext'
- 16. MVVM:ViewModel应该有一个成员到另一个ViewModel吗?
- 17. 我应该创建C++中只有一个函数的子类吗?
- 18. RESTful控制器中的SHOW操作应该始终只有一个资源吗?
- 19. 只有一个孩子的嵌套ExpandableListView应该一次可见
- 20. ui.bootstrap.collapse - 两个崩溃 - 只有一个应该打开
- 21. 当只有一个人应该打开两个窗口
- 22. 检测到多个事件,其中应该只有一个
- 23. 两个背景图像,只有一个应该重复
- 24. 多个messageDialog的开放当只有一个应该
- 25. jquery应该只触发一个事件
- 26. 为什么只有一个spark工作只使用一个执行器运行?
- 27. 什么时候应该/不应该在Spark中序列化一个类?
- 28. 一个有用的宝石版本应该有版本1.0吗?
- 29. 什么应该是一个React组件,什么应该只是一个HTML?
- 30. 我应该在每个视图中都有一个NSFetchedResultsController吗?
谢谢,它帮助我:) –