你好,我是尉刚强。

在学完了第2、3节课之后,我们已经清楚了并行设计的重要性,也掌握了几类典型的并行设计架构模式,但是在编码实现的过程中,这些并行设计架构模式还需要依赖底层的并发框架才能完成。所以今天这节课,我就和你聊一聊并发框架的选择和使用秘诀。

其实不同的编程语言中,可用的并发框架种类非常多,比如 Java 语言有 Thread Pool 框架、Akka 框架、Reactor 响应式框架等;C++ 语言有 CAF 框架、Theron 框架等;Go 语言有 goroutine 等。

这些并发框架之间的差异很大,如果选择或使用不当,会很容易导致开发出来的软件性能比较差。而且,现在也依旧有不少的程序员,对这些并发框架并没有比较系统的认识,在选择和使用并发框架时,经常是比较随意的。

所以在今天的课程中,我就来告诉你当碰到具体的业务问题时,你应该如何选择更合适的并发框架,以及在使用中要遵循什么样的方法,才能发挥出并发框架的最佳性能。另外,在课程中我主要是以 Java 语言为例,来重点给你讲解 Thread Pool 框架、Akka 并发框架、Reactor 响应式框架的基本原理与特点,以及它们在使用过程中的一些注意事项,让你能最大化地发挥并发框架的性能优势。

而如果你是从事其他编程语言的开发工作,当然也可以参考这节课的内容,因为接下来我要介绍的 Java 并发框架,它们也代表了如今在并发系统设计中比较主流的三种框架(线程池、Actor 模型、响应式架构)。

那接下来,就从我们最熟悉的 Thread Pool 框架开始学习吧。

Java Thread Pool 框架

Java 的 Thread Pool 框架是目前最流行的一个并发框架,因为它使用起来比较方便,适用的场景也非常多。同时,它也是其他并发框架(如 Akka)内部实现所依赖的技术,所以理解和学习这个框架是很重要的。

那么,为了更好地理解 Java Thread Pool 框架,我们先来看下它的框架模型图:

从图的左边开始看,继承接口 Runnable、Callable 的具体实现任务,在调用 ExecutorService.submit 接口时,会提交任务到 ExecutorService 内部的一个任务队列中。同时,在 ExecutorService 内部还存在一个预先申请的线程池(Thread Pool),线程池中的线程会从任务队列中领取一个任务来执行。

那么由此我们也能发现,在 Java 语言中,与直接在代码中创建线程相比,采用 Thread Pool 这种机制有很多好处:第一个好处,就是在 Thread Pool 中,你可以重复利用已创建的线程资源,从而减少线程创建和销毁造成的额外开销;第二个好处是,当有新业务请求到达时,你可以直接使用已创建的线程来处理业务,所以还可以最大化地减少处理时延。

其实,对于一个软件系统而言,线程是非常重要的稀缺资源,而线程池技术也是有效管理线程资源、最大化提升软件性能的关键手段之一。

但是,我见过不少的软件系统,在使用线程池时根本没有章法,每个开发人员在自己的业务模块中随意创建线程池,而对于整个软件系统来说,业务代码中一共创建了多少个线程池、每个线程池的资源规模配置如何,都是很含糊的,从而就导致开发出的软件性能总是处于不可控的状态。

所以通常来说,在使用线程池设计实现并发系统的时候,你需要针对线程池的创建与配置进行全局设计。那么这里的问题就是,你应该依据什么样的规则来划分线程池组?以及如何去配置线程池使用的资源呢?

实际上,就我的实践经验来看,我认为应该根据以下两个维度来划分线程池组:

  1. 首先,你应该根据不同的业务逻辑特点来划分线程组,比如说,可以将以 CPU 计算为主和以 IO 处理为主的业务逻辑,划分到不同的线程池组中;
  2. 其次,你还可以根据不同的业务功能的优先级,划分出不同的线程池组。

这样,当线程池组的划分确定之后,接下来,你就可以根据 JVM 中可用的 CPU 核资源数目(你可以使用 Runtime.getRuntime().availableProcessors() 获取 JVM 可用的 CPU 核数),给不同的线程池组分配合理的线程资源额度

然后,在对线程池组配置可用的线程资源时,你还需要针对不同线程池上的业务特点,选择不一样的线程资源配置策略。比如说,针对 CPU 计算密集型业务,只需保持线程池配置可用的线程数,与可以分配的 CPU 核数相等即可;而针对 IO 密集型业务,由于业务中的阻塞请求比较多,所以可以将配置的线程数提高到可用 CPU 核数的两倍以上。

当然,我这里只是介绍了大体的配置思路,当你在为线程池组配置可用的线程时,最好是基于真实的业务运行特性分析,并从全局统筹分配之后,再为每个线程池配置合适的线程资源。

OK,现在我们再回头看一下前面那个线程池框架模型图,不知你发现没有,这个框架模型中并没有考虑线程之间的通信机制要怎么实现。那么你可能就会想:当业务中的线程之间存在信息交互时,应该怎么办呢?

这个时候,你肯定会想到,可以基于 Java 并发消息队列来进行通信,还可以使用各种同步互斥锁呀。

的确,在 Java 语言中,内置的并发消息队列与互斥锁等机制,几乎可以满足线程间的各种同步交互需求,如果合理设计并使用,也可以很好地发挥出软件性能。

不过,在真实的业务开发过程中,并发消息队列和锁机制如果使用不当,不仅容易导致软件出现很严重的故障,而且也容易引起系统中的某些线程长时间阻塞,从而不能很好地满足业务的性能需求。另外,并发消息队列和锁在解决同步互斥和数据一致性的问题时,带来的内部开销也会在一定程度上消耗软件的性能。

那么,有没有不需要基于直接使用并发消息队列和锁,来设计和实现高并发系统的框架呢?

答案当然是有的,我接下来要给你介绍的 Akka 并发框架,就是为了解决这个问题。

Akka 并发框架

首先我们知道,Akka 是基于 Actor 模型实现的一套并发框架。所以这里,我们同样是先通过一个 Actor 核心模型图,来了解下 Akka 并发框架的特点:

在这个模型图中,每个 Actor 代表的是可以被调度执行的轻量单元。如图中所示,Actor A 和 Actor C 在向 Actor B 发送消息时,所有消息会被底层框架发送到 Actor B 的 Mailbox 中,然后底层的 Akka 框架调度代码会触发 Actor B,来接收并执行消息的后续处理。这样,基于 Actor 模型的这套并发框架,首先就保证了消息可以被安全地在各个 Actor 之间传递,同时也保证了每个 Actor 实例可以串行处理接收到的所有消息。

因此,采用基于 Actor 模型的 Akka 框架,在开发实现软件时,你就不需要关注底层的并发交互同步了,只需要聚焦到业务中设计每个 Actor 实现的业务逻辑,它需要接收什么消息,又需要向谁发送什么消息。

另外,由于 Actor 模型中的消息机制,实现了消息在 Actor 之间传递时会被串行处理,所以就天然避免了在消息交互中需要解决的数据一致性的问题。也就是说,针对系统中并发单元间存在大量信息交互的场景,选用 Akka 并发框架在性能上会存在一定的优势。

其实,Actor 模型还有一个更大的优势,就是 Actor 是非常轻量的,它可以支持很大规模的并发,并负载均衡到各个 CPU 核上,从而可以充分发挥硬件资源,进一步提升软件的运行性能。

那么接下来,为了更好地理解这个原理,我们来看一个任务拆分示意图,它描述了两种不同的任务拆分方式,以及将拆分的子任务映射到 CPU 具体核上的执行过程。

在图中,左侧的方法 1,代表的是传统基于线程的粒度并发拆分,你能够发现,这里想要拆分成大小均匀的并发子任务,其实是很有挑战的。而当拆分出的子任务大小规模差别比较大时,然后当它们被映射到底层 CPU 中的核上执行时,就会造成 CPU 核上的负载不均衡的情况。

这也就是说,传统的任务拆分方式会出现某些核处于空闲状态,而另外的核上还有线程在执行的场景,所以在这种场景下,CPU 多核的性能空间就无法发挥到极致。

而图中右侧的方法 2,代表的是 Actor 的细粒度任务拆分,它可以把业务功能拆分成大量的轻量级的 Actor 子任务。而由于每个 Actor 都非常轻量,Akka 的底层调度框架就可以将这些 Actor 子任务均匀地分布到多个 CPU 硬件核上,从而可以最大化地发挥 CPU 的性能。

所以,你在实际的业务开发中要注意,如果在使用 Actor 时,没有利用好 Actor 轻量级的特性,开发出来的 Actor 承载的业务逻辑太多,导致 Actor 的任务粒度过大,那么就很难发挥出 Actor 的最佳性能表现。

OK,在理解了这种并发框架的使用优势之后,你可能仍然存在一个问题,就是究竟什么样的业务系统会存在大量的并发信息交互,比较适合采用 Akka 并发框架呢?

按照我的实践经验,一般来说,CPU 计算密集型的软件系统会比较适合采用 Akka 并发框架。如果你发现业务系统中,存在大量基于并发消息队列的通信,且核心业务都是围绕着 CPU 计算逻辑,而 IO 请求并不是核心的业务逻辑,那么你的系统就很可能比较适用 Akka 并发框架。

实际上,很多种计算执行引擎就是比较典型的代表。比如,我之前开发的智能对话引擎,需要将多个计算模型的计算结果放在一起进行比较分析,那它就非常适合采用 Akka 并发 Actor 框架模型。

不过,对于一些典型的互联网微服务来说,当它们收到 REST 请求后,实现的核心业务逻辑主要是针对数据库 CRUD,或是针对其他服务的 REST 接口调用,同时,这些不同的 REST 请求业务还是相对独立的。那么,这类系统就应该属于 IO 密集型业务,所以选择采用 Akka 并发框架,往往优势就不是很大。

那么,针对 IO 密集型业务,是不是选用线程池并发框架就是性能最佳的方案呢?

其实也不一定,下面我们就一起看下 Reactor 并发框架的实现特点,并了解下它在解决 IO 密集型业务时存在的优势吧。

Reactor 响应式框架

Reactor 架构是一种基于数据流的响应式架构模式,严格来说它可能不算是完整的并发框架,但是却内置了灵活调整并发的机制和能力。

对于不太熟悉函数式编程范式的程序员来说,可能理解与使用 Reactor 架构会有些挑战。不过没有关系,在今天的课程中,我会帮你搞清楚 Reactor 架构模型的基本原理和优势是什么,你并不需要囿于细节。而当你在实际的业务中,需要决策是否使用这款并发框架时,再选择深入学习具体的用法也不迟。

好,首先,我们还是来看看 Reactor 框架的工作原理图:

如上图所示,输入流 Flux 就是 Reactor 中典型的异步消息流,它代表了一个包含 0 个到 N 个的消息序列。另外,图中的 Rule 代表的是一个基于消息的处理逻辑或规则,输入流中的消息可以被中间多个处理逻辑组合连续加工之后,再生成一个包含 0 个到 N 个的输出消息流 Flux。

那么在看完原理图之后,我们需要思考一个问题:Reactor 为什么要采用这样的计算模型呢,它又可以给软件的性能带来什么样的优势呢?

其实,这里主要会带来两个比较明显的优势,接下来我就给你重点介绍下。

**第一个比较大的性能优势,就是它提供了背压机制。**如果通俗点讲,那就是图中的中间处理规则(Rule),在接收处理消息时采用的是 Pull 模式,所以不存在数据消息积压的情况。而对于传统的分布式并发系统而言,内部消息堆积是一个很普遍的影响性能的因素,所以使用 Reactor 框架,就可以避免这种情况发生。

**第二个比较大的性能优势,就是在中间的消息处理规则实现中,针对 IO 的交互操作可以采用非阻塞的异步交互。**而原来传统的基于线程与 IO 交互的实现过程中,不管是使用直接的 IO 请求,或者基于 Future 的 get 机制,都不可避免地会发生当前线程被阻塞的情况。所以基于 Reactor 的异步响应式交互模式,在处理多 IO 请求时性能会更出色。

另外,在 Spring Boot 2.0 版本之后,也提供了对 Reactor 的全面支持,可以支持你去实现事件驱动模型的后端开发,从而更好地发挥软件的性能优势。

小结

在今天的课程中,我主要讲解了 Thread Pool 并发框架、Akka 的 Actor 并发模型和 Reactor 的响应式架构的核心原理与性能特点。其中,Thread Pool 是使用最普遍,也是其他并发框架的底座;而基于 Actor 模型的 Akka,更适合对计算密集型且交互比较多的并发场景;而基于 Reactor 响应式架构,在针对消息流处理的、基于 IO 密集型的异步交互场景来说,有比较大的性能优势。

那么,在学习完今天的课程后,当你碰到特定的应用场景时,就可以基于这些并发架构的原理与特点,来选择适合产品的并发架构。但是要注意,选择并发框架只是在一定程度上,减少了开发高性能软件的复杂度,而最终开发出的软件的性能,还取决于你是否找到了更适合业务特性的高性能实现方案。

所以,你还需要继续深入理解业务逻辑,寻找到特定并发框架下,让软件性能更佳的设计与实现方法。

思考题

针对 IO 密集型软件系统,采用 Thread Pool 框架开发软件性能,是不是一定比采用 Akka 的并发框架的性能差呢?