5.1 属性

  1. .columns:以列表的形式返回所有的列名
  2. .dtypes:以列表的形式返回所有的列的名字和数据类型。形式为:[(col_name1,col_type1),...]
  3. .isStreaming:如果数据集的数据源包含一个或者多个数据流,则返回True
  4. .na:返回一个DataFrameNaFunctions 对象,用于处理缺失值。
  5. .rdd: 返回DataFrame 底层的RDD(元素类型为Row
  6. .schema:返回DataFrameschema
  7. .stat:返回DataFrameStatFunctions 对象,用于统计
  8. .storageLevel:返回当前的缓存级别
  9. .write:返回一个DataFrameWriter对象,它是no-streaming DataFrame 的外部存储接口
  10. .writeStream:返回一个DataStreamWriter 对象,它是streaming DataFrame 的外部存储接口