《网络架构系列2-Http详解》

530 阅读11分钟

不诗意的女程序媛不是好厨师~ 转载请注明出处,From李诗雨---blog.csdn.net/cjm24848365…

在这里插入图片描述

1. Http的协议简介

1.1什么是Http?

HTTP即:Hyper Text Transfer Protocol(超文本传输协议)的缩写。

它是用于从万维网(WWW:World Wide Web )服务器传输超文本到本地浏览器的传送协议。

HTTP是一个基于TCP/IP通信协议来传递数据(HTML 文件, 图片文件, 查询结果等)。

1.2 Http的三个特点

HTTP三点注意事项:

  • HTTP是无连接:无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间。
  • HTTP是媒体独立的:这意味着,只要客户端和服务器知道如何处理的数据内容,任何类型的数据都可以通过HTTP发送。客户端以及服务器指定使用适合的MIME-type内容类型。
  • HTTP是无状态:HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就较快。

1.3 Http的历史

  • 1991年 Http/0.9 只有Get命令,只能获取文本信息。
  • 1996年 Http/1.0 标准版本 丰富了命令,可以发送任何格式内容(文字、图像、视频、二进制文件等)。
  • 1997年Http/1.1 一直比较流行的版本 引入持久连接,TCP默认不关闭,可被多个请求复用。
  • 2015年Http/2.0 采用二进制格式而非文本格式,允许服务器主动推送。

在这里插入图片描述

2.Http的报文格式

2.1 Http请求报文

在这里插入图片描述

一个HTTP请求报文由四个部分组成:请求行、请求头部、空行、请求数据。

  • 请求行由请求方法字段、URL字段和HTTP协议版本字段3个字段组成,它们用空格分隔。

  • 请求头部:Http客户程序(例如浏览器),向服务器发送请求的时候必须指明请求类型(一般是GET或者 POST)。

    如有必要,客户程序还可以选择发送其他的请求头。大多数请求头并不是必需的,但Content-Length除外。

    对于POST请求来说 Content-Length必须出现。

    还有下文说的缓存机制的相关信息也放在请求头中。

  • 空行: 它的作用是通过一个空行,告诉服务器请求头部到此为止。

  • 请求数据: 若方法字段是GET,则此项为空,没有数据

    若方法字段是POST,则通常来说此处放置的就是要提交的数据

    比如要使用POST方法提交一个表单,其中有user字段中数据为“admin”, password字段为123abc,那么这里的请求数据就是 user=admin&password=123abc,使用&来连接各个字段。

    概括点来说,HTTP请求报文格式如下:

在这里插入图片描述

2.2 Http响应报文

同样的,HTTP响应报文也由四部分组成:响应行、响应头、空行、响应体

  • 响应行: 一般由协议版本、状态码及其描述组成 如 HTTP/1.1 200 OK
  • 响应头: 用于描述服务器的基本信息,以及数据的描述,服务器通过这些数据的描述信息,可以通知客户端如何处理等一会儿它回送的数据。如下文要说的一些缓存信息。
  • 空行: 它的作用是通过一个空行,告诉服务器请求头部到此为止。
  • 响应体: 就是响应的消息体,如果是纯数据就是返回纯数据,如果请求的是HTML页面,那么返回的就是HTML代码,如果是js就是JS代码,如此之类。

3.Http请求的传输过程

像穿衣服一样,早上起床是:由里向外的一层一层穿上;

睡觉时,再从外到里的一层一层脱下。

或者说像洋葱~~~总之你理解就好。

在这里插入图片描述

4.一次完整Http请求的过程(面试点▲▲▲)

面试时经常会被问到,“请说一下一次完整的Http请求过程是怎样的”?

那么到底是怎样的呢?请看下文:

  • 域名解析

    这个是由于,socket只认识ip地址,不认识域名,所以要先进行域名解析。

  • 建立TCP连接

    HTTP 是比 TCP 更高层次的应用层协议,根据规则,只有低层协议建立之后才能进行更高层协议的连接,因此,首先要建立 TCP 连接。TCP通过三次握手建立连接,在前一篇文章中说过。

  • 浏览器向服务器发送请求命令

    一旦建立了 TCP 连接,Web 浏览器就会向 Web 服务器发送请求命令。

    例如:GET/hello/index.jsp HTTP/1.1。浏览器发送其请求命令之后,还要以头信息的形式向Web服务器发送一些别的信息(例:Accept ,User-Agent 等),之后浏览器发送了一空白行来通知服务器,它已经结束了该头信息的发送。

  • Web服务器应答

    客户端向服务器发出请求后,服务器会进行应答。

  • Web服务器关闭TCP连接

    一般情况下,一旦 Web 服务器向浏览器发送了请求的数据,它就要关闭 TCP 连接。

    但是如果浏览器或者服务器在其头信息加入了这行代码:Connection:keep-alive,TCP连接在发送后将仍然保持打开状态,于是,浏览器可以继续通过相同的连接发送请求。保持连接节省了为每个请求建立新连接所需的时间,还节约了网络带宽。

  • 浏览器接受到服务器响应的数据

    浏览器接受服务器应答回来的 html 代码和css,和js代码再进行页面的渲染或者接受到应答的文件进行保存等操作。

概括一下流程就是:

浏览器发起请求 → 解析域名得到ip→进行TCP连接 →浏览器发送HTTP请求和头信息发送→服务器对浏览器进行应答,响应头信息和浏览器所需的内容→ 关闭TCP连接或保持→浏览器得到数据数据进行操作

5.Http的缓存机制及原理(面试点▲▲▲)

关于缓存机制和原理这部分内容,我看到了一篇写得极好的文章:www.cnblogs.com/chenqf/p/63… ,所以这一部分的内容我就直接转载了。

5.1 先来大概了解一下两种缓存规则

HTTP缓存有多种规则,根据是否需要重新向服务器发起请求来分类,我将其分为两大类(强制缓存对比缓存)

下面我们通过时序图的方式来学习两种缓存规则:

为方便大家理解,我们认为浏览器存在一个缓存数据库,用于存储缓存信息。 在客户端第一次请求数据时,此时缓存数据库中没有对应的缓存数据,需要请求服务器,服务器返回后,将数据存储至缓存数据库中。

在这里插入图片描述

然后,我们再分别来看看强制缓存和对比缓存的时序图~

已存在缓存数据时,仅基于强制缓存,请求数据的流程如下:

在这里插入图片描述

已存在缓存数据时,仅基于对比缓存,请求数据的流程如下:

在这里插入图片描述

我们可以看到两类缓存规则的不同,强制缓存如果生效,不需要再和服务器发生交互,而对比缓存不管是否生效,都需要与服务端发生交互。 两类缓存规则可以同时存在,强制缓存优先级高于对比缓存,也就是说,当执行强制缓存的规则时,如果缓存生效,直接使用缓存,不再执行对比缓存规则。

问题: 基于对比缓存的流程下,不管是否使用缓存,都需要向服务器发送请求,那么还用缓存干什么?

答案是: 服务端在进行标识比较后,只返回header部分,通过状态码通知客户端使用缓存,不再需要将报文主体部分返回给客户端。所以,在对比缓存生效时,状态码为304,报文大小和请求时间都会大大减少。

5.2 强制缓存

从上文我们知道,强制缓存,在缓存数据未失效的情况下,可以直接使用缓存数据,那么浏览器是如何判断缓存数据是否失效呢? 我们知道,在没有缓存数据的时候,浏览器向服务器请求数据时,服务器会将数据和缓存规则一并返回,缓存规则信息包含在响应header中。

对于强制缓存来说,响应header中会有两个字段来标明失效规则 Expires/Cache-Control 使用chrome的开发者工具,可以很明显的看到对于强制缓存生效时,网络请求的情况

在这里插入图片描述

Expires   Expires的值为服务端返回的到期时间,即下一次请求时,请求时间小于服务端返回的到期时间,直接使用缓存数据。 不过Expires 是HTTP 1.0的东西,现在默认浏览器均默认使用HTTP 1.1,所以它的作用基本忽略。 另一个问题是,到期时间是由服务端生成的,但是客户端时间可能跟服务端时间有误差,这就会导致缓存命中的误差。 所以HTTP 1.1 的版本,使用Cache-Control替代。

Cache-Control Cache-Control 是最重要的规则。常见的取值有private、public、no-cache、max-age,no-store,默认为private。 private: 客户端可以缓存 public: 客户端和代理服务器都可缓存(前端的同学,可以认为public和private是一样的) max-age=xxx: 缓存的内容将在 xxx 秒后失效 no-cache: 需要使用对比缓存来验证缓存数据(后面介绍) no-store: 所有内容都不会缓存,强制缓存,对比缓存都不会触发(对于前端开发来说,缓存越多越好,so...基本上和它说886)

5.3 对比缓存

对比缓存,顾名思义,需要进行比较判断是否可以使用缓存。 浏览器第一次请求数据时,服务器会将缓存标识与数据一起返回给客户端,客户端将二者备份至缓存数据库中。 再次请求数据时,客户端将备份的缓存标识发送给服务器,服务器根据缓存标识进行判断,判断成功后,返回304状态码,通知客户端比较成功,可以使用缓存数据。

第一次访问的截图:

在这里插入图片描述

再次访问的截图:

在这里插入图片描述

通过两图的对比,我们可以很清楚的发现,在对比缓存生效时,状态码为304,并且报文大小和请求时间大大减少。 原因是,服务端在进行标识比较后,只返回header部分,通过状态码通知客户端使用缓存,不再需要将报文主体部分返回给客户端。

对于对比缓存来说,缓存标识的传递是我们着重需要理解的,它在请求header和响应header间进行传递, 一共分为两种标识传递,接下来,我们分开介绍。

Last-Modified / If-Modified-Since

Last-Modified: 服务器在响应请求时,告诉浏览器资源的最后修改时间。

在这里插入图片描述

If-Modified-Since: 再次请求服务器时,通过此字段通知服务器上次请求时,服务器返回的资源最后修改时间。 服务器收到请求后发现有头If-Modified-Since 则与被请求资源的最后修改时间进行比对。 若资源的最后修改时间大于If-Modified-Since,说明资源又被改动过,则响应整片资源内容,返回状态码200; 若资源的最后修改时间小于或等于If-Modified-Since,说明资源无新修改,则响应HTTP 304,告知浏览器继续使用所保存的cache。

在这里插入图片描述

Etag / If-None-Match

优先级高于Last-Modified / If-Modified-Since

Etag: 服务器响应请求时,告诉浏览器当前资源在服务器的唯一标识(生成规则由服务器决定)。

\[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lEQKnjrZ-1580551223283)(G:\新建文件夹\腾讯课堂\学习笔记\网络框架公开课\pic\响应头3.png)\]

If-None-Match: 再次请求服务器时,通过此字段通知服务器客户段缓存数据的唯一标识。 服务器收到请求后发现有头If-None-Match 则与被请求资源的唯一标识进行比对, 不同,说明资源又被改动过,则响应整片资源内容,返回状态码200; 相同,说明资源无新修改,则响应HTTP 304,告知浏览器继续使用所保存的cache。

\[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CQO9YbAh-1580551223286)(G:\新建文件夹\腾讯课堂\学习笔记\网络框架公开课\pic\相应头4.png)\]

总结

对于强制缓存,服务器通知浏览器一个缓存时间,在缓存时间内,下次请求,直接用缓存,不在时间内,执行比较缓存策略。对于比较缓存,将缓存信息中的Etag和Last-Modified通过请求发送给服务器,由服务器校验,返回304状态码时,浏览器直接使用缓存。

浏览器第一次请求:

在这里插入图片描述

浏览器再次请求:

在这里插入图片描述