HTTP:资源是怎么协商、表述的?

935 阅读7分钟

网络协议之所以是叫做协议,而不是规定,就是因为传输什么内容,前后端都得商量着来

客户端需要什么,需要告诉服务端;服务端发什么给客户端,要看客户端能不能看懂

那他们又是怎么商量的呢?以前学习过HTTP协议的同学肯定知道,是根据请求行来进行协商的

HTTP协议中又是怎么定义协商内容的呢?协商好之后又该怎么表述呢?

今天就来聊聊上面的这些个问题,希望我的文字能让你把这些内容弄清楚

内容协商

在HTTP中,内容协商分为2种,分别是主动式内容协商响应式内容协商

之前没接触过的童鞋,听到这些名词肯定是稀里糊涂的,别着急,咱们一个一个的来

主动式内容协商

千言万语不如一张图来的形象,先上张主动式内容协商的过程图

起点是客户端(Client),先看看图,看不懂没关系,有个印象就好了。不然接下来我说的内容,对你来说可能就是天书了

这图猛的一看挺复杂的,花里胡哨一大堆。其实过程非常简单

其实就是客户端发起了一个HTTP1.1的GET请求资源后,服务端返回资源的一个情况

发起GET请求后,通过AcceptAccept-LanguageAccept-Encoding这三个请求头,客户端告诉服务器:我现在要一个text/类型的文件,并且我只接受这个文件语言为en(英语),我这里能看得懂的编码格式只有br、gzip格式,q(权重)都是0.8,你(服务器)有哪种编码格式随便给我都行

服务器看到我们的要求,根据我们的要求以及请求的URL,就到这个URL里定位的资源,寻找是否有符合我们要求的资源

我们请求的URL在服务器是存在对应文件的,所以告诉我们状态码是200,并且把URLe对应的资源给到了我们(客户端)

告诉了我们这是个text/html文件,语言是en,编码方式为br,均是符合我们上述提出的要求

我们(客户端)拿到符合要求的文件,也就可以正常解析数据了

响应式内容协商

来,咱们再来看看什么是响应式内容协商,还是老规矩,先上一张图,韵个味

看懂了之前的主动式内容协商,我相信这张图你也能看的七七八八。因为区别并不大

区别就在于Client(客户端)请求了之后,居然给我们一个300(重定向),而不是我们之前的200(OK)

居然还要我们再去请求一次,才把URLe的内容给我们

其实这就是响应式与主动式的区别所在了

在响应式内容协商中,客户端发送请求,服务器端无法抉择要返回什么内容,所以就把客户端请求的URL对应的资源列表全部返回,然后由客户端自行抉择。客户端进行选择后再去访问指定资源

而因为RFC中没有明确指出客户端应该依据怎样的规则去对资源进行抉择,所以各大浏览器的实现方式都不一致

又因为各大浏览器实现方式都不统一,相对来说,用到响应式内容协商的地方就很少了

质量因子

上面有些内容大家如果没有学过HTTP协议,会发现有些东西看不太明白,比如q是什么玩意?

前面为了便于你们的理解,我在最开始出现的时候,写了个注释--权重

它本身的含义是表示内容的质量或者可接受因子的优先级

内容的质量,就比如说图片展示的质量:

若只需要展示供用户快速浏览的缩略图,我们可以对图片进行大范围的压缩,这样图片质量会很低,质量因子也很低

若为医学用图,需要展示高清图,我们不能丢失图片细节,图片内容质量高,质量因子自然也就很高了

可接受因子的优先级,最常用的就是字符编码与语言的优先级展示

这次就拿个实例来说,这样感触也更深一点

Accept-Language:zh-cn,zh;q=0.8,en-us;q=0.7,en;q=0.6

zh-cn:简体中文,zh:中文,这两个质量因子都是0.8,但是优先展示简体中文,如果服务器中没有简体中文的资源,则寻找中文资源,若还是没有该资源,则接着就是美式英语(en-us),最后再是展示英语(en)

总结来说:质量因子越大,意味着资源权重越高,越优先展示。质量因子一致,则排序在前面的先展示

常见的协商要素除了质量因子之外,还有以下几个请求头

  • 字符编码 Accept-Charset:ISO8859-1,UTF-8;q=0.7,*;q=0.7 资源的编码格式
  • 内容编码 Accept-Encoding:gzip,br 主要指压缩算法
  • 表述语言 Accept-Language:zh-cn,zh;q=0.8,en-us;q=0.7,en;q=0.6 前面已经提到了,主要用于语言的优先级展示

看懂前面的内容了,这三个应该还算很好理解的吧

资源表述

我们要的资源也跟服务器要到了,那我们该怎么表述这个资源呢?

注意我的用词哦,是表述资源,不是解析资源

换句话说,就是资源的自我介绍,告诉别人它是属于哪一种编码类型,内容又是如何编码的,对应的是什么地方的语言

主要是通过以下三个头字段来进行资源的表述

  • 媒体类型编码
    • Content-type:text/html;charset=utf-8
  • 内容编码
    • Content-encoding:gzip
  • 语言
    • Content-Languague:zh;en

是不是有种似曾相识的感觉?没错,上面我们在告诉服务端我们需要什么文件时,请求头上有三个字段与这三哥们特别相似

没印象的可以往上面翻一翻,基本上就是ContentAccept一个单词的区别

这也体现出了HTTP协议的特性,可读性高与低门槛

ContentAccept就像是相亲中的一男一女,女方(Accept)提出要求,作为媒婆的服务器,就把符合条件的男方(Content)拿出来,男方把自己的简历拿出来(Content-type等资源表述请求头),俩人对上眼了,自然也就过上了幸福生活(200 OK)

还记得十年前的上网环境么?经常有小网站出现乱码,其实就是因为媒体类型编码格式不对导致

内容编码就是告诉我们客户端/服务器所支持的编码类型,假如客户端不支持gzip的编码,服务器发给客户端gzip资源,客户端拿到这东西,也看不懂这是啥玩意

最后一个Content-Language我想大家都应该熟悉的,毕竟混迹互联网这么长时间,你就没上过国外的小网站?

别想多了,我说的是apple.com之流,截图以证清白!

写在最后

今天就写到这里了,内容不算多,但是也不算少了

网络协议这东西还真的是不好写,基础的内容实在太多了。我想来想去,还是从实践入手学习最快,就选了从我们每天都接触的HTTP协议开始说起

比如说状态码,请求头,响应头之类的这些特别基础的东西,巴拉巴拉一大堆,说来说去也说不出什么花样

本来协议这东西就很枯燥乏味,一个写不好就成了文档翻译。干货掺水真不是一件容易的事情

如果觉得写得不错,不要忘了点个好看哟