一文带你区分阻塞、非阻塞、同步、异步IO

1,301 阅读4分钟

img

前言:在之前的Redis面试套路拆解的文章[Redis面试套路拆解(一)]中有提到过IO模型,并且IO模型本身也是一个比较容易混淆的高频面试考点,小黑板将在本篇文章帮你理清思路,区分各种IO模型~

img

其实网络上已经有很多博客讲了这个问题,但是总是觉得看完之后还是迷迷糊糊的,感觉大家有点太执着于把这个问题讲的通俗易懂了,经常会举各种各样的例子,比如烧水、去银行办理业务之类的,然而看完之后反倒会产生更多的疑问,因为可能举得例子并不能完美的适用于同步异步、阻塞非阻塞的概念

所以我们今天就不举例子了,小黑板想从专业概念的角度来帮助大家理解各种概念~

img

在讨论问题之前,我们需要确定一下上下文,以免产生误解,本文讨论的背景是基于Linux的网络IO开展的

实际上无论是哪一种IO模型,都可以分为两个阶段(read操作为例**)**:

  • 等待数据准备就绪

  • 将数据从内核态拷贝到用户空间

这里我们需要解释一下,什么是内核态用户态

img

  • 用户态:也称为用户空间,即上层应用程序的活动空间,应用程序的执行必须依赖于内核提供的资源

  • 内核态:也称为内核空间,控制计算机的硬件资源,并提供上层应用程序运行的环境

注:用户态可以通过系统调用切换到内核态**,这是主动进入到内核态**。此外在出现异常或者外围设备的中断也会进入到内核态,不过是被动响应的

先说结论:各种IO模型其实是根据它在上述两个阶段的不同表现(用户进程或者线程是否阻塞)来区分的!!!

在第一个阶段用户进程是否阻塞用来区分阻塞/非阻塞,在第二个阶段用户是否阻塞用来区分同步/异步!!!

阻塞IO

img

当用户进程发起系统调用recvfrom时,在第一阶段,内核首先会等待数据准备就绪**,这个过程中用户进程是阻塞的;在第二阶段,当数据准备就绪之后,数据会从内核空间拷贝到用户空间(应用程序空间),这个过程中用户进程同样是阻塞的,直到数据拷贝完成才恢复。**

所以,阻塞IO在两个阶段都是阻塞的!!

非阻塞IO

img

非阻塞IO和阻塞IO相似,区别在于第一阶段,在等待数据准备就绪的过程中,用户进程不会阻塞,而是在数据没有准备就绪的时候得到一个error返回,这是用户进程就知道数据还没有准备好,然后就可以继续发起recvfrom操作直到数据准备就绪

在第二阶段,数据从内核空间向用户空间拷贝时,非阻塞IO用户进程同样是阻塞的

IO多路复用

img

IO多路复用实际上是通过select/epoll等函数轮询多个socket,当用户进程调用了select函数,整个用户进程就会被阻塞,直到收到数据准备就绪的返回

后续的操作和非阻塞IO是类似的,由于在recvfrom系统调用之前,需要的数据就已经准备就绪了,所以第一个阶段是非阻塞的第二个阶段同样还是阻塞

所以IO多路复用整个过程中,用户进程都是阻塞的~

异步IO

img

异步IO实际上是用户进程发起read操作之后,就会立刻收到一个返回,所以用户进程就可以去完成其他的工作,而不需要阻塞;直到数据准备就绪并且完成了从内核空间向用户空间拷贝的工作,这时用户进程会收到一个通知,告诉他read操作已完成

整个过程中用户进程不会被阻塞

总结

所以实际上阻塞IO和非阻塞IO都是同步IO,用到了特殊的异步函数才是异步IO

如果能从IO过程的两个阶段来看待这些问题,就不会被这些概念和一些例子绕晕了

希望本文对大家有帮助,如果有收获的话请点点赞和在看哟~