阅读 303

音视频(第一节基础)

一、基础

1.回想一下中学物理课本声音是怎么产生的?声音是由物体震动而产生的,声波

2.声波的三要素:频率、振幅、波形

3.声音的传播需要介质来传播

二、数字音频

       对于声音,人类的耳朵能听到的声音频率范围为20Hz~20000Hz,如果低于这个范围的话就叫做次声波,而若是高于这个范围的则是叫做超声波。 频率的单位是HZ,中文为赫兹,是电,磁,声波和机械振动每秒的周期次数(周期/秒)。

1.声音采样,量化 将声音数字化

2.编码

声音储存即音频编码,编码的指标就是压缩比,通常是小于1,否则没有必要去做压缩,压缩可以减少数据容量。压缩算法包括有损压缩和⽆损压缩。⽆损压缩是指解压后的数据可以完全复原。在常⽤的压缩格式中,⽤得较多的是有损压缩,有损压缩是指解压后的数据不能完全复原,会丢失⼀部分信息,压缩⽐越⼩,丢失的信息就越多,信号还原后的失真就会越⼤。根据不同的应⽤场景(包括存储设备、传输⽹络环境、播放设备等),可以选⽤不同的压缩编码算法,如PCM、WAV、AAC、MP3、Ogg等。

常用的编码

 (1)WAV编码(2)MP3编码(3)AAC编码(4)Ogg编码 

3.图像的表示方法

1.RGB

对于⼀幅图像,⼀般使⽤整数表⽰⽅法来进⾏描述,⽐如计算⼀张1280×720的RGBA_8888图像的⼤⼩,可采⽤如下⽅式:    RGBA_8888(a,r,g,b) 表示每个为8个字节
1280 * 720 * 4 = 3.516MB 

2.YUV

3.RGB 与YUV 的相互转化(ios)

4.视频的编码

1.视频编码

⾳频压缩主要是去除冗余信息,从⽽实现数据量的压缩。那么对于视频压缩,又该从哪⼏⽅⾯来对数据进⾏压缩呢?其实与前⾯提到的⾳频编码类似,视频压缩也是通过去除冗余信息来进⾏压缩的。相较于⾳频数据,视频数据有极强的相关性,也就是说有⼤量的冗余信息,包括空间上的冗余信息和时间上的冗余信息。 

2.编码概念

视频压缩中,每帧都代表着⼀幅静⽌的图像。⽽在进⾏实际压缩时,会采取各种算法以减少数据的容量,其中IPB帧就是最常见的⼀种。
1.IPB帧
视频压缩中,每帧都代表着⼀幅静⽌的图像。⽽在进⾏实际压缩时,会采取各种算法以减少数据的容量,其中IPB帧就是最常见的⼀种。

·I帧:

帧内编码帧(intra picture),I帧通常是每个GOP(MPEG所使⽤的⼀种视频压缩技术的第⼀个帧,经过适度地压缩,作为随机访问的参考点,可以当成静态图像。I帧可以看作⼀个图像经过压缩后的产物,I帧压缩可以得到6:1的压缩⽐⽽不会产⽣任何可觉察的模糊现象。I帧压缩可去掉视频的空间冗余信息,下⾯即将介绍的P帧和B帧是为了去掉时间冗余信息。

·P帧:

前向预测编码帧(predictive-frame),通过将图像序列中前⾯已编码帧的时间冗余信去除来压缩传输数据量的编码图像,也称为预测帧。

·B帧:

双向预测内插编码帧(bi-directional interpolated predictionframe),既考虑源图像序列前⾯的已编码帧,又顾及源图像序列后⾯的已编码帧之间的时间冗余信息,来压缩传输据量的编码图像,也称为双向预测帧。

基于上⾯的定义,我们可以从解码的⾓度来理解IPB帧。·I帧⾃⾝可以通过视频解压算法解压⼀张单独的完整视频画⾯,所以I帧去掉的是视频帧在空间维度上的冗余信息。·P帧需要参考其前⾯的⼀个I帧或者P帧来解码成⼀张完整的视频画⾯。·B帧则需要参考其前⼀个I帧或者P帧及其后⾯的⼀个P帧来⽣成⼀张完整的视频画⾯,所以P帧与B帧去掉的是视频帧在时间维度上的冗余信息。

IDR帧与I帧的理解 

IDR帧为特许的I帧,这⼀帧之后的所有参考帧只会参考到这个IDR帧,⽽不会再参考前⾯的帧。在解码器中,⼀旦收到⼀个IDR帧,就会⽴即清理参考帧缓冲区,并将IDR帧作为被参考的帧。