累加器、广播变量

  1. spark 中的累加器(accumulator) 和广播变量(broadcast variable) 都是共享变量(所谓共享,就是在驱动器程序和工作节点之间共享)

    • 累加器用于对信息进行聚合
    • 广播变量用于高效的分发较大的对象