一张图读懂 RxJava 中的线程控制

2,743 阅读5分钟

有一次和团队一起讨论RxJava的用法和实现机制。在讨论中,@坚坚老师 问了一个有趣的问题:如果调用链中包含多个subscribeOn和observeOn,会是什么情况?

这实际上是一个至关重要的问题,因为在任何情况下,我们都应该弄清楚我们写的每一行代码到底是运行在哪个线程上。这个问题绝对不能含糊。

假设有下面这段伪代码:

其中,lift1, lift2, lift3, lift4指的是基于lift实现的变换操作,比如filter, map, reduce等。

那么在这段代码中:

  • lift1, lift2, lift3, lift4指定的代码分别在哪个线程执行?

  • doOnSubscribe指定的代码在哪个线程执行?

  • 产生事件的代码(create指定的代码)在哪个线程执行?

  • 消费事件的代码(subscribe指定的代码)在哪个线程执行?

相信很多同学会觉得这段代码多少有些令人晕眩,在实际中是不太可能出现的。确实,实际中的代码大都没有这么复杂,但弄清它有助于我们理解整个RxJava的实现流程。

上面这幅图表达了一个典型的RxJava调用链中控制流的传递过程。它可以分成两个阶段:

  1. 驱动阶段。整个异步事件流的触发由subscribe开始。它发起了一个反向驱动过程(从下游到上游),跨过每一个中间的Observable和OnSubscribe,到达第一个Observable(产生事件的源头)。对应图中的(1)和(2)。这个阶段一般就是从下游到上游调用一次就结束了。

  2. 事件发射阶段。第一个Observable开始产生事件,然后事件流就开始正向传递,经过每一个中间的Observable,最终到达Subscriber(事件的消费者)。对应图中的(3)。与前一阶段不同,事件从上游往下游传递,不是一次就完了,而是多个事件组成的事件流。

我们分析一下这整个流程,其中有几点需要特别说明一下(注:这里的分析过程涉及RxJava的一些实现细节,如不关心细节可以跳过这一段,直接看后面的结论):

  • 图中的(1)对应的是调用前一级Observable的OnSubscribe.call,是个无返回值的方法,因此可以切换线程,从而变为异步的。所以用虚线表示。

  • 图中的(2)对应的是lift操作指定的Operator.call,是个有返回值的方法(输入一个Subscriber,返回一个新的Subscriber)。因此,它只能同步调用,不能切换线程。所以用实线表示。

  • 图中的(3)对应的是调用后一级Observable对应的Subscriber(onNext, onCompleted, onError),也都是无返回值的方法,因此可以切换线程,从而变为异步的。所以也用虚线表示。

  • observeOn是基于lift实现的,且切换线程的动作发生在Subscriber(onNext, onCompleted, onError),因此它影响(3)流程上在它下游的所有lift变换。

  • subscribeOn不是基于lift实现的,它直接在调用前一级Observable的OnSubscribe时切换线程。因此,它影响(1)流程上在它上游的所有OnSubscribe调用,直到产生事件的源头;然后,(3)流程上的所有lift操作也会在新切换到的线程上,直到碰到一个observeOn操作。

  • doOnSubscribe稍微特殊一点。它虽然是基于lift实现的,但它所指定的代码发生在Operator.call中,不像其它的lift操作,它们指定的代码发生在Subscriber。因此它的执行线程受它下游的subscribeOn的影响。

结合上面的分析,我们沿着前面流程图中箭头所指的方向一路走过去:

  • 首先从调用subscribe方法开始,沿着前面流程图中的(1)->(2)->(1)->(2)…->(1)路径(即驱动阶段),从下游向上游回溯,每经过一个subscribeOn,线程就切换一次;每次切换的线程环境影响这一路径上后面(即上游)的doOnSubscribe指定的代码和产生事件的代码(create指定的代码)。

  • 经过事件的源头(create指定的代码),转而进入事件发射阶段。

  • 然后,再沿着(3)路径(即事件发射阶段),从上游到下游,每经过一个observeOn,线程就切换一次;每次切换的线程环境影响这一路径上后面(即下游)的所有lift操作,直至消费事件的代码(subscribe指定的代码)。

现在,把前面的描述换一种说法,就很容易得到下面的结论了:

  • doOnSubscribe指定的代码和产生事件的代码(create指定的代码),在它们下游最近的一个subscribeOn指定的Scheduler上执行;如果它们下游没有subscribeOn了,那么它们就在调用subscribe方法的那一个线程上执行(注意:是调用subscribe方法的那一个线程,不是subscribe指定的代码执行的那个线程,这是两回事)。

  • 普通的lift操作(比如filter, map, reduce等)和消费事件的代码(subscribe指定的代码),在它们上游最近的一个observeOn指定的Scheduler上执行;如果它们上游没有observeOn了,那么它们就在位于整个调用链最上游的第一个subscribeOn指定的Scheduler上执行;如果没找到subscribeOn调用,那么它们就在调用subscribe方法的那一个线程上执行。

把这些结论应用在本文开始的那段代码上,我们很快能得到:

  • 产生事件的代码(create指定的代码)在scheduler1上执行;

  • lift1和lift2指定的代码在scheduler1上执行;

  • lift3和lift4指定的代码在scheduler2上执行;

  • doOnSubscribe指定的代码在scheduler5上执行;

  • 消费事件的代码(subscribe指定的代码)在scheduler6上执行。