6
A
回答
6
阿帕奇星火2.0.0的API都停留在很大程度上类似于1.X,星火 2.0 0.0确实有API的重大更改
阿帕奇星火2.0.0是2.x版本的首次发布。主要更新为API可用性,SQL 2003支持,性能改进,结构化流媒体,R UDF支持以及运营改进。在火花2
新:
- ,我可以看到的是,DataSet和数据帧的API将被合并的最大的变化。
- 与前辈相比,来自Spark的最新和最好的将是一个很大的效率。 Spark 2.0将专注于Parquet和缓存的组合,以实现更好的吞吐量。
- 结构化流媒体是另一件大事!
- 这将是第一个专注于ETL的版本。后续版本将增加更多的运营商和库ETL
你可以通过Spark release 2.0.0凡在以下几点更新说明:星火SQL
- API稳定性
- 核心和
- SparkR
- Streaming
- 依赖性,包装和运营
- 减除,行为变化和弃用
- 已知问题
4
没有相对于太大的差别,以架构作为简而言之仍然是DAG和RDD,这是最它的重要组成部分!
虽然Spark 2.0更加优化,并且具有DataSet Api,它可以为开发人员提供更强大的功能。 所以我会说这个架构是一样的,它只是Spark 2.0提供了很多优化,并且有一套丰富的Api!
这些被Apache提供的主要的事情星火2.0:
- ,我可以看到的最大变化是,DataSet和数据帧的API 将被合并。
- 从Spark的最新和最好的将是一个整体 很多与前辈相比效率。 Spark 2.0正在将 重点放在Parquet和缓存的组合上,以实现更好的吞吐量。
- 结构化流媒体是另一件大事!
- 这将是 第一个版本,将重点关注ETL。后续版本将增加更多的运营商和库ETL
欲了解更多信息,请采取这里乐:https://www.quora.com/What-are-special-features-and-advantages-of-Apache-Spark-2-0-over-earlier-versions
相关问题
- 1. Apache Spark vs Apache Ignite
- 2. Apache Phoenix vs Hive-Spark
- 3. Apache Spark与Apache Storm
- 4. Apache Spark SQL NumberFormatException
- 5. Apache Spark Worker Timeout
- 6. Apache Spark GraphX java.lang.ArrayIndexOutOfBoundsException
- 7. apache spark集群
- 8. Apache Spark配置
- 9. Apache Spark mapPartitionsWithIndex
- 10. java apache spark mllib
- 11. apache spark实现
- 12. Apache Spark - java.lang.NoSuchMethodError:breeze.linalg.DenseVector
- 13. Apache Spark性能
- 14. Talend和Apache Spark?
- 15. Apache Spark FileNotFoundException
- 16. Apache Spark与python
- 17. Apache spark - java.lang.NoClassDefFoundError
- 18. apache spark Streaming error
- 19. 'where'in apache spark
- 20. 的Apache Sqoop和Spark
- 21. Apache Spark RDD拆分“|”
- 22. Scala vs Python中的Apache SPARK SVM
- 23. Apache Spark DataSet API:head(n:Int)vs take(n:Int)
- 24. java.lang.NoClassDefFoundError:org/apache/spark/deploy/SparkSubmit
- 25. Apache Spark Stderr和Stdout
- 26. Spark Apache源代码
- 27. 加入流Apache Spark
- 28. Apache Spark的分区
- 29. java.lang.NoClassDefFoundError:org/apache/spark/sql/SchemaRDD
- 30. Apache SPARK与SQLContext :: IndexError