计算机程序的思维逻辑 (70) - 原子变量和CAS

2,033 阅读11分钟

本系列文章经补充和完善,已修订整理成书《Java编程的逻辑》(马俊昌著),由机械工业出版社华章分社出版,于2018年1月上市热销,读者好评如潮!各大网店和书店有售,欢迎购买:京东自营链接

从本节开始,我们探讨Java并发工具包java.util.concurrent中的内容,本节先介绍最基本的原子变量及其背后的原理和思维。

原子变量

什么是原子变量?为什么需要它们呢?

理解synchronized一节,我们介绍过一个Counter类,使用synchronized关键字保证原子更新操作,代码如下:

public class Counter {
    private int count;

    public synchronized void incr(){
        count ++;
    }
    
    public synchronized int getCount() {
        return count;
    }
}

对于count++这种操作来说,使用synchronzied成本太高了,需要先获取锁,最后还要释放锁,获取不到锁的情况下还要等待,还会有线程的上下文切换,这些都需要成本。

对于这种情况,完全可以使用原子变量代替,Java并发包中的基本原子变量类型有:

  • AtomicBoolean:原子Boolean类型
  • AtomicInteger:原子Integer类型
  • AtomicLong:原子Long类型
  • AtomicReference:原子引用类型

这是我们主要介绍的类,除了这四个类,还有一些其他的类,我们也会进行简要介绍。

针对Integer, Long和Reference类型,还有对应的数组类型:

  • AtomicIntegerArray
  • AtomicLongArray
  • AtomicReferenceArray

为了便于以原子方式更新对象中的字段,还有如下的类:

  • AtomicIntegerFieldUpdater
  • AtomicLongFieldUpdater
  • AtomicReferenceFieldUpdater

AtomicReference还有两个类似的类,在某些情况下更为易用:

  • AtomicMarkableReference
  • AtomicStampedReference

你可能会发现,怎么没有针对char, short, float, double类型的原子变量呢?大概是用的比较少吧,如果需要,可以转换为int/long,然后使用AtomicInteger或AtomicLong。比如,对于float,可以使用如下方法和int相互转换:

public static int floatToIntBits(float value)
public static float intBitsToFloat(int bits);

下面,我们先来看几个基本原子类型,从AtomicInteger开始。

AtomicInteger

基本用法

AtomicInteger有两个构造方法:

public AtomicInteger(int initialValue)
public AtomicInteger()

第一个构造方法给定了一个初始值,第二个的初始值为0。

可以直接获取或设置AtomicInteger中的值,方法是:

public final int get()
public final void set(int newValue) 

之所以称为原子变量,是因为其包含一些以原子方式实现组合操作的方法,比如:

//以原子方式获取旧值并设置新值
public final int getAndSet(int newValue)
//以原子方式获取旧值并给当前值加1
public final int getAndIncrement()
//以原子方式获取旧值并给当前值减1
public final int getAndDecrement()
//以原子方式获取旧值并给当前值加delta
public final int getAndAdd(int delta)
//以原子方式给当前值加1并获取新值
public final int incrementAndGet()
//以原子方式给当前值减1并获取新值
public final int decrementAndGet()
//以原子方式给当前值加delta并获取新值
public final int addAndGet(int delta)

这些方法的实现都依赖另一个public方法:

public final boolean compareAndSet(int expect, int update)

这是一个非常重要的方法,比较并设置,我们以后将简称为CAS。该方法以原子方式实现了如下功能:如果当前值等于expect,则更新为update,否则不更新,如果更新成功,返回true,否则返回false。

AtomicInteger可以在程序中用作一个计数器,多个线程并发更新,也总能实现正确性,我们看个例子:

public class AtomicIntegerDemo {
    private static AtomicInteger counter = new AtomicInteger(0);

    static class Visitor extends Thread {
        @Override
        public void run() {
            for (int i = 0; i < 100; i++) {
                counter.incrementAndGet();
                Thread.yield();
            }
        }
    }

    public static void main(String[] args) throws InterruptedException {
        int num = 100;
        Thread[] threads = new Thread[num];
        for (int i = 0; i < num; i++) {
            threads[i] = new Visitor();
            threads[i].start();
        }
        for (int i = 0; i < num; i++) {
            threads[i].join();
        }
        System.out.println(counter.get());
    }
}

程序的输出总是正确的,为10000。

基本原理和思维

AtomicInteger的使用方法是简单直接的,它是怎么实现的呢?它的主要内部成员是:

private volatile int value;

注意,它的声明带有volatile,这是必需的,以保证内存可见性。

它的大部分更新方法实现都类似,我们看一个方法incrementAndGet,其代码为:

public final int incrementAndGet() {
    for (;;) {
        int current = get();
        int next = current + 1;
        if (compareAndSet(current, next))
            return next;
    }
}

代码主体是个死循环,先获取当前值current,计算期望的值next,然后调用CAS方法进行更新,如果当前值没有变,则更新并返回新值,否则继续循环直到更新成功为止。

与synchronized锁相比,这种原子更新方式代表一种不同的思维方式。

synchronized是悲观的,它假定更新很可能冲突,所以先获取锁,得到锁后才更新。原子变量的更新逻辑是乐观的,它假定冲突比较少,但使用CAS更新,也就是进行冲突检测,如果确实冲突了,那也没关系,继续尝试就好了。

synchronized代表一种阻塞式算法,得不到锁的时候,进入锁等待队列,等待其他线程唤醒,有上下文切换开销。原子变量的更新逻辑是非阻塞式的,更新冲突的时候,它就重试,不会阻塞,不会有上下文切换开销。

对于大部分比较简单的操作,无论是在低并发还是高并发情况下,这种乐观非阻塞方式的性能都要远高于悲观阻塞式方式。

原子变量是比较简单的,但对于复杂一些的数据结构和算法,非阻塞方式往往难于实现和理解,幸运的是,Java并发包中已经提供了一些非阻塞容器,我们只需要会使用就可以了,比如:

  • ConcurrentLinkedQueue和ConcurrentLinkedDeque:非阻塞并发队列
  • ConcurrentSkipListMap和ConcurrentSkipListSet:非阻塞并发Map和Set

这些容器我们在后续章节介绍。

但compareAndSet是怎么实现的呢?我们看代码:

public final boolean compareAndSet(int expect, int update) {
    return unsafe.compareAndSwapInt(this, valueOffset, expect, update);
}

它调用了unsafe的compareAndSwapInt方法,unsafe是什么呢?它的类型为sun.misc.Unsafe,定义为:

private static final Unsafe unsafe = Unsafe.getUnsafe();

它是Sun的私有实现,从名字看,表示的也是"不安全",一般应用程序不应该直接使用。原理上,一般的计算机系统都在硬件层次上直接支持CAS指令,而Java的实现都会利用这些特殊指令。从程序的角度看,我们可以将compareAndSet视为计算机的基本操作,直接接纳就好。

实现锁

基于CAS,除了可以实现乐观非阻塞算法,它也可以用来实现悲观阻塞式算法,比如锁,实际上,Java并发包中的所有阻塞式工具、容器、算法也都是基于CAS的 (不过,也需要一些别的支持)。

怎么实现呢?我们演示一个简单的例子,用AtomicInteger实现一个锁MyLock,代码如下:

public class MyLock {
    private AtomicInteger status = new AtomicInteger(0);

    public void lock() {
        while (!status.compareAndSet(0, 1)) {
            Thread.yield();
        }
    }

    public void unlock() {
        status.compareAndSet(1, 0);
    }
}

在MyLock中,使用status表示锁的状态,0表示未锁定,1表示锁定,lock()/unlock()使用CAS方法更新,lock()只有在更新成功后才退出,实现了阻塞的效果,不过一般而言,这种阻塞方式过于消耗CPU,有更为高效的方式,我们后续章节介绍。MyLock只是用于演示基本概念,实际开发中应该使用Java并发包中的类如ReentrantLock。

AtomicBoolean/AtomicLong/AtomicReference

AtomicBoolean/AtomicLong/AtomicReference的用法和原理与AtomicInteger是类似的,我们简要介绍下。

AtomicBoolean

AtomicBoolean可以用来在程序中表示一个标志位,它的原子操作方法有:

public final boolean compareAndSet(boolean expect, boolean update)
public final boolean getAndSet(boolean newValue) 

实际上,AtomicBoolean内部使用的也是int类型的值,用1表示true, 0表示false,比如,其CAS方法代码为:

public final boolean compareAndSet(boolean expect, boolean update) {
    int e = expect ? 1 : 0;
    int u = update ? 1 : 0;
    return unsafe.compareAndSwapInt(this, valueOffset, e, u);
}

AtomicLong

AtomicLong可以用来在程序中生成唯一序列号,它的方法与AtomicInteger类似,就不赘述了。它的CAS方法调用的是unsafe的另一个方法,如:

public final boolean compareAndSet(long expect, long update) {
    return unsafe.compareAndSwapLong(this, valueOffset, expect, update);
}

AtomicReference

AtomicReference用来以原子方式更新复杂类型,它有一个类型参数,使用时需要指定引用的类型。以下代码演示了其基本用法:

public class AtomicReferenceDemo {
    static class Pair {
        final private int first;
        final private int second;

        public Pair(int first, int second) {
            this.first = first;
            this.second = second;
        }

        public int getFirst() {
            return first;
        }

        public int getSecond() {
            return second;
        }
    }

    public static void main(String[] args) {
        Pair p = new Pair(100, 200);
        AtomicReference<Pair> pairRef = new AtomicReference<>(p);
        pairRef.compareAndSet(p, new Pair(200, 200));

        System.out.println(pairRef.get().getFirst());
    }
}

AtomicReference的CAS方法调用的是unsafe的另一个方法:

public final boolean compareAndSet(V expect, V update) {
    return unsafe.compareAndSwapObject(this, valueOffset, expect, update);
}

原子数组

原子数组方便以原子的方式更新数组中的每个元素,我们以AtomicIntegerArray为例来简要介绍下。

它有两个构造方法:

public AtomicIntegerArray(int length)
public AtomicIntegerArray(int[] array) 

第一个会创建一个长度为length的空数组。第二个接受一个已有的数组,但不会直接操作该数组,而是会创建一个新数组,只是拷贝参数数组中的内容到新数组。

AtomicIntegerArray中的原子更新方法大多带有数组索引参数,比如:

public final boolean compareAndSet(int i, int expect, int update)
public final int getAndIncrement(int i)
public final int getAndAdd(int i, int delta)

第一个参数i就是索引。看个简单的例子:

public class AtomicArrayDemo {
    public static void main(String[] args) {
        int[] arr = { 1, 2, 3, 4 };
        AtomicIntegerArray atomicArr = new AtomicIntegerArray(arr);
        atomicArr.compareAndSet(1, 2, 100);
        System.out.println(atomicArr.get(1));
        System.out.println(arr[1]);
    }
}

输出为:

100
2

FieldUpdater

FieldUpdater方便以原子方式更新对象中的字段,字段不需要声明为原子变量,FieldUpdater是基于反射机制实现的,我们会在后续章节介绍反射,这里简单介绍下其用法,看代码:

public class FieldUpdaterDemo {
    static class DemoObject {
        private volatile int num;
        private volatile Object ref;

        private static final AtomicIntegerFieldUpdater<DemoObject> numUpdater
            = AtomicIntegerFieldUpdater.newUpdater(DemoObject.class, "num");
        private static final AtomicReferenceFieldUpdater<DemoObject, Object>
            refUpdater = AtomicReferenceFieldUpdater.newUpdater(
                    DemoObject.class, Object.class, "ref");

        public boolean compareAndSetNum(int expect, int update) {
            return numUpdater.compareAndSet(this, expect, update);
        }

        public int getNum() {
            return num;
        }

        public Object compareAndSetRef(Object expect, Object update) {
            return refUpdater.compareAndSet(this, expect, update);
        }

        public Object getRef() {
            return ref;
        }
    }

    public static void main(String[] args) {
        DemoObject obj = new DemoObject();
        obj.compareAndSetNum(0, 100);
        obj.compareAndSetRef(null, new String("hello"));
        System.out.println(obj.getNum());
        System.out.println(obj.getRef());
    }
}

类DemoObject中有两个成员num和ref,声明为volatile,但不是原子变量,不过DemoObject对外提供了原子更新方法compareAndSet,它是使用字段对应的FieldUpdater实现的,FieldUpdater是一个静态成员,通过newUpdater工厂方法得到,newUpdater需要的参数有类型、字段名、对于引用类型,还需要引用的具体类型。

ABA问题

使用CAS方式更新有一个ABA问题,该问题是指,一个线程开始看到的值是A,随后使用CAS进行更新,它的实际期望是没有其他线程修改过才更新,但普通的CAS做不到,因为可能在这个过程中,已经有其他线程修改过了,比如先改为了B,然后又改回为了A。

ABA是不是一个问题与程序的逻辑有关,如果是一个问题,一个解决方法是使用AtomicStampedReference,在修改值的同时附加一个时间戳,只有值和时间戳都相同才进行修改,其CAS方法声明为:

public boolean compareAndSet(
    V expectedReference, V newReference, int expectedStamp, int newStamp) 

比如:

Pair pair = new Pair(100, 200);
int stamp = 1;
AtomicStampedReference<Pair> pairRef = new AtomicStampedReference<Pair>(pair, stamp);
int newStamp = 2;
pairRef.compareAndSet(pair, new Pair(200, 200), stamp, newStamp);

AtomicStampedReference在compareAndSet中要同时修改两个值,一个是引用,另一个是时间戳,它怎么实现原子性呢?实际上,内部AtomicStampedReference会将两个值组合为一个对象,修改的是一个值,我们看代码:

public boolean compareAndSet(V   expectedReference,
                             V   newReference,
                             int expectedStamp,
                             int newStamp) {
    Pair<V> current = pair;
    return
        expectedReference == current.reference &&
        expectedStamp == current.stamp &&
        ((newReference == current.reference &&
          newStamp == current.stamp) ||
         casPair(current, Pair.of(newReference, newStamp)));
}

这个Pair是AtomicStampedReference的一个内部类,成员包括引用和时间戳,具体定义为:

private static class Pair<T> {
    final T reference;
    final int stamp;
    private Pair(T reference, int stamp) {
        this.reference = reference;
        this.stamp = stamp;
    }
    static <T> Pair<T> of(T reference, int stamp) {
        return new Pair<T>(reference, stamp);
    }
}

AtomicStampedReference将对引用值和时间戳的组合比较和修改转换为了对这个内部类Pair单个值的比较和修改。

AtomicMarkableReference是另一个AtomicReference的增强类,与AtomicStampedReference类似,它也是给引用关联了一个字段,只是这次是一个boolean类型的标志位,只有引用值和标志位都相同的情况下才进行修改。

小结

本节介绍了各种原子变量的用法以及背后的原理CAS,对于并发环境中的计数、产生序列号等需求,考虑使用原子变量而非锁,CAS是Java并发包的基础,基于它可以实现高效的、乐观、非阻塞式数据结构和算法,它也是并发包中锁、同步工具和各种容器的基础。

下一节,我们讨论并发包中的显式锁。

(与其他章节一样,本节所有代码位于 github.com/swiftma/pro…)


未完待续,查看最新文章,敬请关注微信公众号“老马说编程”(扫描下方二维码),深入浅出,老马和你一起探索Java编程及计算机技术的本质。用心原创,保留所有版权。