4.1 通用保存

  1. .format(source):设置数据格式

    • 返回self
    1. df.write.format('json').save('./data.json')
  2. .mode(saveMode):当要保存的目标位置已经有数据时,设置该如何保存。

    • 参数: saveMode 可以为:

      • 'append':追加写入
      • 'overwrite':覆写已有数据
      • 'ignore':忽略本次保存操作(不保存)
      • 'error':抛出异常(默认行为)
    • 返回self

    • 示例:

      1. df.write.mode('append').parquet('./data.dat')
  3. .partitionBy(*cols):按照指定的列名来将输出的DataFrame 分区。

    • 返回self

    • 示例:

      1. df.write.partitionBy('year', 'month').parquet('./data.dat')
  4. .save(path=None, format=None, mode=None, partitionBy=None, **options):保存DataFrame