2016-10-21 244 views

回答

6

阿帕奇星火2.0.0的API都停留在很大程度上类似于1.X,星火 2.0 0.0确实有API的重大更改

阿帕奇星火2.0.0是2.x版本的首次发布。主要更新为API可用性,SQL 2003支持,性能改进,结构化流媒体,R UDF支持以及运营改进。在火花2

新:

  • ,我可以看到的是,DataSet和数据帧的API将被合并的最大的变化。
  • 与前辈相比,来自Spark的最新和最好的将是一个很大的效率。 Spark 2.0将专注于Parquet和缓存的组合,以实现更好的吞吐量。
  • 结构化流媒体是另一件大事!
  • 这将是第一个专注于ETL的版本。后续版本将增加更多的运营商和库ETL

你可以通过Spark release 2.0.0凡在以下几点更新说明:星火SQL

  • MLlib
    • API稳定性
    • 核心和
    • SparkR
    • Streaming
    • 依赖性,包装和运营
    • 减除,行为变化和弃用
    • 已知问题
    4

    没有相对于太大的差别,以架构作为简而言之仍然是DAG和RDD,这是最它的重要组成部分!

    虽然Spark 2.0更加优化,并且具有DataSet Api,它可以为开发人员提供更强大的功能。 所以我会说这个架构是一样的,它只是Spark 2.0提供了很多优化,并且有一套丰富的Api!

    这些被Apache提供的主要的事情星火2.0:

    • ,我可以看到的最大变化是,DataSet和数据帧的API 将被合并。
    • 从Spark的最新和最好的将是一个整体 很多与前辈相比效率。 Spark 2.0正在将 重点放在Parquet和缓存的组合上,以实现更好的吞吐量。
    • 结构化流媒体是另一件大事!
    • 这将是 第一个版本,将重点关注ETL。后续版本将增加更多的运营商和库ETL

    欲了解更多信息,请采取这里乐:https://www.quora.com/What-are-special-features-and-advantages-of-Apache-Spark-2-0-over-earlier-versions