78. 同步访问共享的可变数据

  关键字 synchronized 可以保证在同一时刻,只有一个线程可以执行某一个方法,或者某一个代码块。许多程序员把同步的概念仅仅理解为一种互斥( mutual exclusion )的方式,即,当一个对象被一个线程修改的时候,可以阻止另一个线程观察到对象内部不一致的状态。按照这种观点,对象被创建的时候处于一致的状态(详见第 17 条),当有方法访问它的时候,它就被锁定了。这些方法观察到对象的状态,并且可能会引起状态转变( statetransition ),即把对象从一种一致的状态转换到另一种一致的状态。正确地使用同步可以保证没有任何方法会看到对象处于不一致的状态中。

  这种观点是正确的,但是它并没有说明同步的全部意义。如果没有同步,一个线程的变化就不能被其他线程看到。同步不仅可以阻止一个线程看到对象处于不一致的状态之中,它还可以保证进入同步方法或者同步代码块的每个线程,都能看到由同一个锁保护的之前所有的修改效果。

  Java 语言规范保证读或者写一个变量是原子的( atomic ),除非这个变量的类型为 long 或者 double [JLS , 17.4, 17.7] 。换句话说,读取一个非 long 或 double 类型的变量,可以保证返回值是某个线程保存在该变量中的, 即使多个线程在没有同步的情况下并发地修改这个变量也是如此。

  你可能昕说过,为了提高性能,在读或写原子数据的时候,应该避免使用同步。这个建议是非常危险而错误的。虽然语言规范保证了线程在读取原子数据的时候,不会看到任意的数值,但是它并不保证一个线程写入的值对于另一个线程将是可见的。 为了在线程之间进行可靠的通信,也为了互斥访问,同步是必要的。 这归因于 Java 语言规范中的内存模型(memory model),它规定了一个线程所做的变化何时以及如何变成对其他线程可见[JLS ,17.4; Goetz06, 16]。

  如果对共享的可变数据的访问不能同步,其后果将非常可怕,即使这个变量是原子可读写的。以下面这个阻止一个线程妨碍,另一个线程的任务为例。Java 的类库中提供了 Thread.stop 方法,但是在很久以前就不提倡使用该方法了,因为它本质上是不安全的一一使用它会导致数据遭到破坏。 千万不要使用 Thread.stop 方法。 要阻止一个线程妨碍另一个线程,建议的做法是让第一个线程轮询( poll ) 一个 boolean 字段,这个字段一开始为 false ,但是可以通过第二个线程设置为 true ,以表示第一个线程将终止自己。由于 boolean 字段的读和写操作都是原子的,程序员在访问这个字段的时候不再需要使用同步:

  1. // Broken! - How long would you expect this program to run?
  2. public class StopThread {
  3. private static Boolean stopRequested;
  4. public static void main(String[] args)
  5. throws InterruptedException {
  6. Thread backgroundThread = new Thread(() -> {
  7. int i = 0;
  8. while (!stopRequested)
  9. i++;
  10. });
  11. backgroundThread.start();
  12. TimeUnit.SECONDS.sleep(1);
  13. stopRequested = true;
  14. }
  15. }

  你可能期待这个程序运行大约一秒钟左右,之后主线程将 stopRequested 设置为 true ,致使后台线程的循环终止。但是在我的机器上,这个程序永远不会终止:因为后台线程永远在循环!

  问题在于,由于没有同步,就不能保证后台线程何时‘看到’主线程对 stopRequested 的值所做的改变。没有同步,虚拟机将以下代码:

  1. while (!stopRequested)
  2. i++;

  转变成这样:

  1. if (!stopRequested)
  2. while (true)
  3. i++;

  这种优化称作提升( hoisting ),正是 OpenJDK Server VM 的工作。结果是一个活性失败(liveness failure):这个程序并没有得到提升。修正这个问题的一种方式是同步访问 stopRequested字段。这个程序会如预期般在大约一秒之内终止:

  1. // Properly synchronized cooperative thread termination
  2. public class StopThread {
  3. private static Boolean stopRequested;
  4. private static synchronized void requestStop() {
  5. stopRequested = true;
  6. }
  7. private static synchronized Boolean stopRequested() {
  8. return stopRequested;
  9. }
  10. public static void main(String[] args)
  11. throws InterruptedException {
  12. Thread backgroundThread = new Thread(() -> {
  13. int i = 0;
  14. while (!stopRequested())
  15. i++;
  16. });
  17. backgroundThread.start();
  18. TimeUnit.SECONDS.sleep(1);
  19. requestStop();
  20. }
  21. }

  注意写方法( requestStop )和读方法( stopRequested )都被同步了。只同步写方法还不够! 除非读和写操作都被同步,否则无法保证同步能起作用。 有时候,会在某些机器上看到只同步了写(或读)操作的程序看起来也能正常工作,但是在这种情况下,表象具有很大的欺骗性。

  StopThread 中被同步方法的动作即使没有同步也是原子的。换句话说,这些方法的同步只是为了它的通信效果,而不是为了互斥访问。虽然循环的每个迭代中的同步开销很小,还是有其他更正确的替代方法,它更加简洁,性能也可能更好。如果 stopRequested 被声明为 volatile ,第二种版本的 StopThread 中的锁就可以省略。虽然 volatile 修饰符不执行互斥访问,但它可以保证任何一个线程在读取该字段的时候都将看到最近刚刚被写入的值:

  1. // Cooperative thread termination with a volatile field
  2. public class StopThread {
  3. private static volatile Boolean stopRequested;
  4. public static void main(String[] args)
  5. throws InterruptedException {
  6. Thread backgroundThread = new Thread(() -> {
  7. int i = 0;
  8. while (!stopRequested)
  9. i++;
  10. });
  11. backgroundThread.start();
  12. TimeUnit.SECONDS.sleep(1);
  13. stopRequested = true;
  14. }
  15. }

  在使用 volatile 的时候务必要小心。以下面的方法为例,假设它要产生序列号:

  1. // Broken - requires synchronization!
  2. private static volatile int nextSerialNumber = 0;
  3. public static int generateSerialNumber() {
  4. return nextSerialNumber++;
  5. }

  这个方法的目的是要确保每个调用都返回不同的值(只要不超过 232 个调用) 。这个方法的状态只包含一个可原子访问的字段: nextSerialNumber ,这个字段的所有可能的值都是合法的。因此,不需要任何同步来保护它的约束条件。然而,如果没有同步,这个方法仍然无法正确地工作。

  问题在于,增量操作符(++)不是原子的。它在 nextSerialNumber 字段中执行两项操作:首先它读取值,然后写回一个新值,相当于原来的值再加上 1。如果第二个线程在第一个线程读取旧值和写回新值期间读取这个字段第二个线程就会与第一个线程一起看到同一个值,并返回相同的序列号。这就是安全性失败( safety failure ):这个程序会计算出错误的结果。

  修正 generateSerialNumber 方法的一种方法是在它的声明中增加 synchronized 修饰符。这样可以确保多个调用不会交叉存取,确保每个调用都会看到之前所有调用的效果。一旦这么做,就可以且应该从 nextSerialNumber 中删除 volatile 修饰符。为了保护这个方法,要用 long 代替 int ,或者在 nextSerialNumber 要进行包装时抛出异常。

  最好还是遵循第 59 条中的建议,使用 AtomicLong 类,它是 java.util.concurrent.atomic 的组成部分。这个包为在单个变量上进行免锁定、线程安全的编程提供了基本类型。虽然 volatile 只提供了同步的通信效果,但这个包还提供了原子性。这正是你想让 generateSerialNumber 完成的工作,并且它可能比同步版本完成得更好:

  1. // Lock-free synchronization with java.util.concurrent.atomic
  2. private static final Atomiclong nextSerialNum = new Atomiclong();
  3. public static long generateSerialNumber() {
  4. return nextSerialNum.getAndIncrement();
  5. }

  避免本条目中所讨论到的问题的最佳办法是不共享可变的数据。要么共享不可变的数据(详见第 17 条),要么压根不共享。换句话说, 将可变数据限制在单个线程中。 如果采用这一策略,对它建立文档就很重要,以便它可以随着程序的发展而得到维护。深刻地理解正在使用的框架和类库也很重要,因为它们引入了你不知道的线程。

  让一个线程在短时间内修改一个数据对象,然后与其他线程共享,这是可以接受的,它只同步共享对象引用的动作。然后其他线程没有进一步的同步也可以读取对象,只要它没有再被修改。这种对象被称作高效不可变( effectively immutable ) [Goetz06, 3.5.4] 。将这种对象引用从一个线程传递到其他的线程被称作安全发布( safe publication) [Goetz06, 3.5.3] 。安全发布对象引用有许多种方法:可以将它保存在静态字段巾,作为类初始化的一部分;可以将它保存在 volatile 字段、final 字段或者通过正常锁定访问的字段中;或者可以将它放到并发的集合中(详见第 81 条)。

  总而言之, 当多个线程共享可变数据的时候,每个读或者写数据的线程都必须执行同步。 如果没有同步,就无法保证一个线程所做的修改可以被另一个线程获知。未能同步共享可变数据会造成程序的活跃性失败( liveness failure )和安全性失败( safety failure ) 。这样的失败是最难调试的。它们可能是间歇性的,且与时间相关,程序的行为在不同的虚拟机上可能根本不同。如果只需要线程之间的交互通信,而不需要互斥, volatile 修饰符就是一种可以接受的同步形式,但要正确地使用它可能需要一些技巧。