UNIX五种IO模型

685 阅读4分钟

在UNIX环境下,有以下五种IO模型:

  • 阻塞式I/O
  • 非阻塞式I/O
  • I/O多路复用
  • 信号驱动I/O
  • 异步I/O
1. 阻塞式I/O
阻塞式I/O模型
阻塞式I/O模型

程序首先调用recvfrom系统调用,recvfrom会一直阻塞至有数据到达并将数据拷贝至用户缓存空间后返回,或者在发生错误后返回。

对于阻塞式I/O,我们的程序会一直处于完全阻塞状态,直至recvfrom系统调用返回结果。

2.非阻塞式I/O
非阻塞式I/O
非阻塞式I/O

上图所示为一个标准的非阻塞式I/O调用过程,系统第一次调用非阻塞式的recvfrom系统调用,如果没有接收到数据,会立马返回EWOULDBLOCK,接下来会继续循环调用recvfrom系统调用,如果没有接收到数据,会立马返回EWOULDBLOCK。如果接收到了数据,会继续执行将数据从内核空间拷贝至用户空间,拷贝完成后返回OK,程序得以继续执行后续的数据操作。

非阻塞式I/O的工作方式就是会持续循环调用recvfrom,如果没有接收到数据,里面返回EWOULDBLOCK,直至接收到了数据,执行数据从内核空间到用户空间的数据拷贝,并返回。上述的循环调用recvfrom的过程称之为polling

阻塞式I/O的循环调用,会造成CPU执行时间的浪费,因为在没有数据返回的情况下,polling的过程都是无异议的询问。

3. I/O多路复用
I/O多路复用
I/O多路复用

I/O多路复用,也称为event driven I/O,其优点在于单个线程可以同时处理多个网络连接I/O。

程序首先调用select,select会阻塞进程,期间不断轮询所负责的socket,当某个socket中的数据准备好了,select就会立即返回,通知用户进程,用户进程再调用recvfrom接收数据,将数据从内核空间拷贝至用户空间,此时recvfrom返回OK,程序再对用户发送的数据进行具体的处理。

从上面过程可以看出,进程一共有两个阻塞过程,一个是select调用过程,阻塞至某socket有数据到达;一个是用户进程再收到select的数据通知后,调用recvfrom接收数据,将数据从内核空间拷贝至用户空间的过程。

当需要同时处理多个客户端接入请求时,可以利用多线程或者I/O多路复用技术

I/O多路复用技术通过把多个I/O的阻塞复用到同一个select调用阻塞上,从而使得系统在单线程的情况下可以同时处理多个客户端请求。

与传统的多线程/多进程模型比,I/O多路复用的最大优势是系统开销小,系统不需要创建新的额外进程或者线程,也不需要维护这些进程和线程的运行,降底了系统的维护工作量,节省了系统资源。

以上分析了阻塞式、非阻塞式、I/O多路复用几种I/O方式,从调用方式上看,无论是非阻塞式I/O(系统不断轮询数据情况,直至数据准备完毕),还是I/O多路复用(通过select调用,用单个进程监控所有网络连接请求,并在请求数据准备好后,通知具体socket,执行阻塞式I/O的数据接收过程),都是系统在顺序且同步等待网络数据的到达,而后执行数据接收,拷贝的过程,只是在获取连接数据准备的状况时使用了不同的方案。

所以,以上三种I/O方式都是同步阻塞式I/O

4.信号驱动I/O
信号驱动I/O
信号驱动I/O

首先调用sigaction系统调用,建立起 signal-driven I/O的socket,并设置一个信号处理函数,该系统调用不会阻塞,立即返回。

当数据准备完毕时,程序会收到一个SIGIO的通知信号,此时我们可以再信号处理函数中调用redvfrom接收数据,并进行具体的数据处理流程。

5.异步I/O
异步I/O
异步I/O

我们首先调用aio_read系统调用,该调用为非阻塞式的,会立即返回。当socket的数据准备好后,会自动执行数据拷贝过程,并将数据准备完毕的信号发送给用户进程,此时会执行之前设置的信号处理函数,进行用户数据的异步处理。

6. 几种I/O方式的比较
几种I/O方式的比较
几种I/O方式的比较

参考资料: Addison Wesley : UNIX Network Programming Volume 1, Third Edition: The Sockets Networking API