不诗意的女程序媛不是好厨师~ 转载请注明出处，From李诗雨---blog.csdn.net/cjm24848365…

1. Http的协议简介

1.1什么是Http？

HTTP即：Hyper Text Transfer Protocol（超文本传输协议）的缩写。

它是用于从万维网（WWW:World Wide Web ）服务器传输超文本到本地浏览器的传送协议。

HTTP是一个基于TCP/IP通信协议来传递数据（HTML 文件, 图片文件, 查询结果等）。

1.2 Http的三个特点

HTTP三点注意事项：

HTTP是无连接：无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求，并收到客户的应答后，即断开连接。采用这种方式可以节省传输时间。
HTTP是媒体独立的：这意味着，只要客户端和服务器知道如何处理的数据内容，任何类型的数据都可以通过HTTP发送。客户端以及服务器指定使用适合的MIME-type内容类型。
HTTP是无状态：HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息，则它必须重传，这样可能导致每次连接传送的数据量增大。另一方面，在服务器不需要先前信息时它的应答就较快。

1.3 Http的历史

1991年 Http/0.9 只有Get命令，只能获取文本信息。
1996年 Http/1.0 标准版本丰富了命令，可以发送任何格式内容（文字、图像、视频、二进制文件等）。
1997年Http/1.1 一直比较流行的版本引入持久连接，TCP默认不关闭，可被多个请求复用。
2015年Http/2.0 采用二进制格式而非文本格式，允许服务器主动推送。

2.Http的报文格式

2.1 Http请求报文

一个HTTP请求报文由四个部分组成：请求行、请求头部、空行、请求数据。

请求行由请求方法字段、URL字段和HTTP协议版本字段3个字段组成，它们用空格分隔。
请求头部：Http客户程序(例如浏览器)，向服务器发送请求的时候必须指明请求类型(一般是GET或者 POST)。

如有必要，客户程序还可以选择发送其他的请求头。大多数请求头并不是必需的，但Content-Length除外。

对于POST请求来说 Content-Length必须出现。

还有下文说的缓存机制的相关信息也放在请求头中。
空行： 它的作用是通过一个空行，告诉服务器请求头部到此为止。
请求数据： 若方法字段是GET，则此项为空，没有数据

若方法字段是POST,则通常来说此处放置的就是要提交的数据

比如要使用POST方法提交一个表单，其中有user字段中数据为“admin”, password字段为123abc，那么这里的请求数据就是 user=admin&password=123abc，使用&来连接各个字段。

概括点来说，HTTP请求报文格式如下：

2.2 Http响应报文

同样的，HTTP响应报文也由四部分组成：响应行、响应头、空行、响应体

响应行： 一般由协议版本、状态码及其描述组成如 HTTP/1.1 200 OK
响应头： 用于描述服务器的基本信息，以及数据的描述，服务器通过这些数据的描述信息，可以通知客户端如何处理等一会儿它回送的数据。如下文要说的一些缓存信息。
空行： 它的作用是通过一个空行，告诉服务器请求头部到此为止。
响应体： 就是响应的消息体，如果是纯数据就是返回纯数据，如果请求的是HTML页面，那么返回的就是HTML代码，如果是js就是JS代码，如此之类。

3.Http请求的传输过程

像穿衣服一样，早上起床是：由里向外的一层一层穿上；

睡觉时，再从外到里的一层一层脱下。

或者说像洋葱~~~总之你理解就好。

4.一次完整Http请求的过程（面试点▲▲▲）

面试时经常会被问到，“请说一下一次完整的Http请求过程是怎样的”？

那么到底是怎样的呢？请看下文：

① 域名解析

这个是由于，socket只认识ip地址，不认识域名，所以要先进行域名解析。
② 建立TCP连接

HTTP 是比 TCP 更高层次的应用层协议，根据规则，只有低层协议建立之后才能进行更高层协议的连接，因此，首先要建立 TCP 连接。TCP通过三次握手建立连接，在前一篇文章中说过。
③ 浏览器向服务器发送请求命令

一旦建立了 TCP 连接，Web 浏览器就会向 Web 服务器发送请求命令。

例如：GET/hello/index.jsp HTTP/1.1。浏览器发送其请求命令之后，还要以头信息的形式向Web服务器发送一些别的信息(例：Accept ,User-Agent 等)，之后浏览器发送了一空白行来通知服务器，它已经结束了该头信息的发送。
④ Web服务器应答

客户端向服务器发出请求后，服务器会进行应答。
⑤ Web服务器关闭TCP连接

一般情况下，一旦 Web 服务器向浏览器发送了请求的数据，它就要关闭 TCP 连接。

但是如果浏览器或者服务器在其头信息加入了这行代码：Connection:keep-alive，TCP连接在发送后将仍然保持打开状态，于是，浏览器可以继续通过相同的连接发送请求。保持连接节省了为每个请求建立新连接所需的时间，还节约了网络带宽。
⑥ 浏览器接受到服务器响应的数据

浏览器接受服务器应答回来的 html 代码和css，和js代码再进行页面的渲染或者接受到应答的文件进行保存等操作。

概括一下流程就是：

浏览器发起请求 → 解析域名得到ip→进行TCP连接 →浏览器发送HTTP请求和头信息发送→服务器对浏览器进行应答，响应头信息和浏览器所需的内容→ 关闭TCP连接或保持→浏览器得到数据数据进行操作

5.Http的缓存机制及原理（面试点▲▲▲）

关于缓存机制和原理这部分内容，我看到了一篇写得极好的文章：www.cnblogs.com/chenqf/p/63… ,所以这一部分的内容我就直接转载了。

5.1 先来大概了解一下两种缓存规则

HTTP缓存有多种规则，根据是否需要重新向服务器发起请求来分类，我将其分为两大类(强制缓存，对比缓存)

下面我们通过时序图的方式来学习两种缓存规则：

为方便大家理解，我们认为浏览器存在一个缓存数据库,用于存储缓存信息。在客户端第一次请求数据时，此时缓存数据库中没有对应的缓存数据，需要请求服务器，服务器返回后，将数据存储至缓存数据库中。

然后，我们再分别来看看强制缓存和对比缓存的时序图~

已存在缓存数据时，仅基于强制缓存，请求数据的流程如下：

已存在缓存数据时，仅基于对比缓存，请求数据的流程如下：

我们可以看到两类缓存规则的不同，强制缓存如果生效，不需要再和服务器发生交互，而对比缓存不管是否生效，都需要与服务端发生交互。两类缓存规则可以同时存在，强制缓存优先级高于对比缓存，也就是说，当执行强制缓存的规则时，如果缓存生效，直接使用缓存，不再执行对比缓存规则。

问题： 基于对比缓存的流程下，不管是否使用缓存，都需要向服务器发送请求，那么还用缓存干什么？

答案是： 服务端在进行标识比较后，只返回header部分，通过状态码通知客户端使用缓存，不再需要将报文主体部分返回给客户端。所以，在对比缓存生效时，状态码为304，报文大小和请求时间都会大大减少。

5.2 强制缓存

从上文我们知道，强制缓存，在缓存数据未失效的情况下，可以直接使用缓存数据，那么浏览器是如何判断缓存数据是否失效呢？我们知道，在没有缓存数据的时候，浏览器向服务器请求数据时，服务器会将数据和缓存规则一并返回，缓存规则信息包含在响应header中。

对于强制缓存来说，响应header中会有两个字段来标明失效规则 Expires/Cache-Control 使用chrome的开发者工具，可以很明显的看到对于强制缓存生效时，网络请求的情况

Expires Expires的值为服务端返回的到期时间，即下一次请求时，请求时间小于服务端返回的到期时间，直接使用缓存数据。不过Expires 是HTTP 1.0的东西，现在默认浏览器均默认使用HTTP 1.1，所以它的作用基本忽略。另一个问题是，到期时间是由服务端生成的，但是客户端时间可能跟服务端时间有误差，这就会导致缓存命中的误差。所以HTTP 1.1 的版本，使用Cache-Control替代。

Cache-Control Cache-Control 是最重要的规则。常见的取值有private、public、no-cache、max-age，no-store，默认为private。 private: 客户端可以缓存 public: 客户端和代理服务器都可缓存（前端的同学，可以认为public和private是一样的） max-age=xxx: 缓存的内容将在 xxx 秒后失效 no-cache: 需要使用对比缓存来验证缓存数据（后面介绍） no-store: 所有内容都不会缓存，强制缓存，对比缓存都不会触发（对于前端开发来说，缓存越多越好，so...基本上和它说886）

5.3 对比缓存

对比缓存，顾名思义，需要进行比较判断是否可以使用缓存。浏览器第一次请求数据时，服务器会将缓存标识与数据一起返回给客户端，客户端将二者备份至缓存数据库中。再次请求数据时，客户端将备份的缓存标识发送给服务器，服务器根据缓存标识进行判断，判断成功后，返回304状态码，通知客户端比较成功，可以使用缓存数据。

第一次访问的截图：

再次访问的截图：

通过两图的对比，我们可以很清楚的发现，在对比缓存生效时，状态码为304，并且报文大小和请求时间大大减少。 原因是，服务端在进行标识比较后，只返回header部分，通过状态码通知客户端使用缓存，不再需要将报文主体部分返回给客户端。

对于对比缓存来说，缓存标识的传递是我们着重需要理解的，它在请求header和响应header间进行传递，一共分为两种标识传递，接下来，我们分开介绍。

Last-Modified / If-Modified-Since

Last-Modified： 服务器在响应请求时，告诉浏览器资源的最后修改时间。

If-Modified-Since： 再次请求服务器时，通过此字段通知服务器上次请求时，服务器返回的资源最后修改时间。服务器收到请求后发现有头If-Modified-Since 则与被请求资源的最后修改时间进行比对。若资源的最后修改时间大于If-Modified-Since，说明资源又被改动过，则响应整片资源内容，返回状态码200；若资源的最后修改时间小于或等于If-Modified-Since，说明资源无新修改，则响应HTTP 304，告知浏览器继续使用所保存的cache。

Etag / If-None-Match

优先级高于Last-Modified / If-Modified-Since

Etag： 服务器响应请求时，告诉浏览器当前资源在服务器的唯一标识（生成规则由服务器决定）。

\[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lEQKnjrZ-1580551223283)(G:\新建文件夹\腾讯课堂\学习笔记\网络框架公开课\pic\响应头3.png)\]

If-None-Match： 再次请求服务器时，通过此字段通知服务器客户段缓存数据的唯一标识。服务器收到请求后发现有头If-None-Match 则与被请求资源的唯一标识进行比对，不同，说明资源又被改动过，则响应整片资源内容，返回状态码200；相同，说明资源无新修改，则响应HTTP 304，告知浏览器继续使用所保存的cache。

\[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CQO9YbAh-1580551223286)(G:\新建文件夹\腾讯课堂\学习笔记\网络框架公开课\pic\相应头4.png)\]

总结

对于强制缓存，服务器通知浏览器一个缓存时间，在缓存时间内，下次请求，直接用缓存，不在时间内，执行比较缓存策略。对于比较缓存，将缓存信息中的Etag和Last-Modified通过请求发送给服务器，由服务器校验，返回304状态码时，浏览器直接使用缓存。

浏览器第一次请求：

浏览器再次请求：

《网络架构系列2-Http详解》