spark学习-SparkSQL-SparkSession与SparkContext-白红宇

spark学习-SparkSQL-SparkSession与SparkContext

阅读量：118 次

发布时间：2019-02-26

本文共 597 字，大约阅读时间需要 1 分钟。

在这里插入图片描述

SparkSession-Spark的一个全新的切入点

　　SparkSession是Spark 2.0引如的新概念。SparkSession为用户提供了统一的切入点，来让用户学习spark的各项功能。

在spark的早期版本中，SparkContext是spark的主要切入点，由于RDD是主要的API，我们通过sparkcontext来创建和操作RDD。对于每个其他的API，我们需要使用不同的context。例如，对于Streming，我们需要使用StreamingContext；对于sql，使用sqlContext；对于Hive，使用hiveContext。但是随着DataSet和DataFrame的API逐渐成为标准的API，就需要为他们建立接入点。所以在spark2.0中，引入SparkSession作为DataSet和DataFrame API的切入点，SparkSession封装了SparkConf、SparkContext和SQLContext。为了向后兼容，SQLContext和HiveContext也被保存下来。

　　SparkSession实质上是SQLContext和HiveContext的组合（未来可能还会加上StreamingContext），所以在SQLContext和HiveContext上可用的API在SparkSession上同样是

转载地址：http://rblk.baihongyu.com/

你可能感兴趣的文章

nginx反向代理、文件批量改名及统计ip访问量等精髓总结