2.1 属性

  1. .builder = <pyspark.sql.session.Builder object at 0x7f51f134a110>:一个Builder实例

  2. .catalog:一个接口。用户通过它来create、drop、alter、query底层的数据库、table 以及 function

    • 可以通过SparkSession.catalog.cacheTable('tableName'), 来缓存表;通过SparkSession.catalog.uncacheTable('tableName') 来从缓存中删除该表。
  3. .confspark 的运行时配置接口。通过它,你可以获取、设置spark、hadoop 的配置。

  4. .read:返回一个DataFrameReader,用于从外部存储系统中读取数据并返回DataFrame

  5. .readStream:返回一个DataStreamReader,用于将输入数据流视作一个DataFrame 来读取

  6. .sparkContext:返回底层的SparkContext

  7. .streams:返回一个StreamingQueryManager对象,它管理当前上下文的所有活动的StreamingQuery

  8. .udf:返回一个UDFRegistration,用于UDF 注册

  9. .version:返回当前应用的spark 版本