浏览器中输入 URL 回车后...

2,514 阅读5分钟

你知道当我们在浏览器中输入 URL 后到获得我们需要的网页资源,这中间需要经历怎样的流程吗?客户端(浏览器)是如何找到目标服务器并从服务器获得所需要的资源的?

如果你从未思考或了解过上述的问题,那么我相信本文会对你在日常的项目实践中有一定的帮助,在本文中我将尽可能详细地介绍浏览器中输入 URL 回车后与服务器进行通信的流程。

当我们在浏览器中输入 URL 并且回车后,主要发生四个过程:查找 IP建立连接相互通信断开连接。主要流程概述如下:

  1. 客户端根据域名查找对应的 IP 地址;
  2. 客户端根据 IP 地址与服务器建立连接;
  3. 客户端与服务器通信;
  4. 客户端与服务器断开连接。

在详细介绍各个流程前,让我们先来了解一下接下来需要接触到的一些名词概念。

IP 地址:指互联网协议地址。是 IP 协议提供的一种统一的地址格式,它为互联网上的每一个网络和每一台主机分配一个逻辑地址,以此来屏蔽物理地址的差异。互联网上每一个网络和每一台主机都会被分配的一个 IP 地址。我们可以把 IP 地址当成具体到门牌号码的地址,只有通过 IP 地址才能确定一台主机的位置。

域名:是由一串用点分隔的名字组成的 Internet上某一台计算机或计算机组的名称,用于在数据传输时标识计算机的电子方位(有时也指地理位置)。由于纯数字的 IP 地址难以被记忆,所以使用有代表意义的字符(域名)来代替纯数字的 IP 地址,但最终仍需要通过域名来查找其对应的 IP 地址才能够找到相应主机的位置。

DNS :域名系统,是互联网的一项服务。它作为将域名和 IP 地址相互映射的一个分布式数据库,能够使人更方便地访问互联网。

URL :统一资源定位符,有时也被俗称为网页地址(网址)。指的是因特网上各种资源的地址。

这里需要区分一下域名(或者 IP 地址)与 URL 的区别,域名确定的是因特网中某台主机的位置;而 URL 则要更为具体,指某台主机中某个资源的具体位置。如 ttsy.com 是一个域名,通过这个域名可以找到其相对应 IP 地址的主机,而 ttsy.com/a/b.jpg 是一个 URL,通过这个 URL 可以找到这台主机上的路径为 /a 的 b.jpg 图片资源。

那么接下来详细介绍上述四个流程~

查找 IP

在我们输入 URL 并且按下回车时,浏览器首先要做的便是通过域名查找对应的 IP 地址,这个过程也称作 DNS 解析。具体的查找过程如下:

  • 浏览器搜索自己的 DNS 缓存,查找成功返回其对应 IP 地址,失败则进行下一步;
  • 搜索系统中的 DNS 缓存,查找成功返回其对应 IP 地址,失败则进行下一步;
  • 搜索系统中的 hosts 文件,查找成功返回其对应 IP 地址,失败则进行下一步;
  • 系统发送一个请求到路由器上,路由器查找其缓存,查找成功返回其对应 IP 地址,失败则进行下一步;
  • 系统将域名发送至 LDNS(本地域名服务器),查找成功返回其对应 IP 地址,失败则 LDNS 向 Root Name Server(根域名服务器)发起请求获得域的顶级域名服务器地址,然后依次请求获得各级域名服务器地址,最后获得域名对应 IP 地址;
  • LDNS 将 IP 地址返回给操作系统并缓存起来;
  • 系统将 IP 地址返回给浏览器并缓存起来;
  • 浏览器获得 IP 地址,发起建立连接的请求。

建立连接--三次握手

浏览器获得 IP 地址后,就会对目标服务器发起建立 TCP 连接的请求,建立连接主要有三个步骤,一般称为客户端与服务器端的三次握手:

  • 浏览器向服务器发送想建立连接的请求「你好,可以认识一下吗」;
  • 服务器向浏览器发送同意建立连接的响应「你好,当然可以啊」;
  • 浏览器向服务器发送确认收到响应的请求,客户端和服务器建立连接「非常高兴认识你」。

相互通信

客户端与服务器建立连接后,便会开始进行通信,这里以客户端向服务器请求网页资源的过程为例:

  • 浏览器向服务器发起一个请求网页资源的请求;
  • 服务器返回对应网页资源;
  • 浏览器渲染、构建网页,在构建网页的过程中,可能会继续请求 CSS、JavaScript 等资源。

断开连接--四次挥手

客户端与服务器的相互通信完成后,便会断开连接,断开连接主要有四个步骤,一般称为客户端与服务器端的四次挥手:

  • 浏览器向服务器发送想断开连接的请求「我要走啦」;
  • 服务器向浏览器发送收到请求的响应「我知道啦」;
  • 服务器向浏览器发送断开连接的请求「可以了」;
  • 浏览器断开连接并向服务器发送一个反馈请求,服务器收到后断开连接「好的,拜拜」。

为什么客户端与服务器断开连接是四次挥手呢?主要是因为当客户端告诉服务器想断开连接的时候,服务器的数据不一定已处理完毕,所以服务器是先告诉客户端说已经收到了它想断开连接的请求,然后当服务器中数据处理完毕时,便通知客户端并请求断开连接,客户端收到后便断开连接并通知服务器,服务器收到后才断开连接。