CVPR 2018 | 图鸭科技荣获图像压缩挑战赛冠军

1,918 阅读3分钟

随着信息时代的到来,图片压缩技术对于信息传输影响越来越大,500W像素的彩色图片需要15M空间存储,如果不经过压缩,对于所有的网站和移动应用都是一个非常大的负担。

自80年代起国内开始引入JPEG等图片压缩标准;但是随着互联网的发展,今天网络每天传输、存储的图片已达到亿万级别;传统压缩算法已经满足不了企业需求。为了减少带宽资源消耗,降低存储压力,减轻服务器压力,企业开始寻求更高效的图像压缩算法。

也应如此,CVPR作为一直关注计算机视觉领域发展的世界顶级学术会议,在今年,联合Google、ETH、Twitter、Amazon、Disney Research、Netflix举办了CVPR 2018的图像压缩挑战赛(CLIC)。目前该比赛已经落下帷幕,图鸭科技的Tucodec TNGcnn4p在该项挑战赛上取得MS-SSIM与MOS两项第一。



这次的挑战赛主要从PSNR、MOS、MS-SSIM和解码速度(评分较高的队伍里解码速度最快)这四个方面进行评比。PSNR、MOS、MS-SSIM这些都是业界通用的图像质量评估(Image Quality Assessment,IQA)标准。


(大赛链接http://www.compression.cc/results/)

图鸭科技图片压缩团队的Tucodec TNGcnn4p压缩在MOS与MS-SSIM值上占据领先优势,取得第一。在PSNR指标上,Tucodec TNG压缩也取得了第二名的好成绩。

MOS与MIS-SSIM值是指用户对于图片的主观感受,比分越高,代表图片还原度越高,丢失的信息越少。

Tucodec TNGcnn4p在MOS和MS-SSIM值上有显著的优势,下图为其与目前业界通用的图像压缩算法BPG、WebP和JPEG2000的对比图:


(TNG压缩与BPG、webp、jpeg2000对比图)

在 MS-SSIM/dB 为 17 时,Tucodec TNGcnn4p 比 BPG 节省 40% 的码率,比 WebP 节省 50%的码率,比 JPEG 2000 节省 75% 的码率。

在 0.15bpp-0.8bpp 这一常用码率范围下,Tucodec TNGcnn4p平均比 BPG 节省 19.75 码字,比 WebP 节省27.08码字,比 JPEG2000 节省 33.28 码字。



(Tucodec TNGcnn4p在验证集和测试集上的实验结果)

据图鸭科技图片压缩团队介绍:Tucodec TNGcnn4p 算法是基于端到端深度学习的算法,在该算法中使用了层次特征融合的网络结构,并结合新的量化方法、码字估计等技术对整体网络进行设计。在训练中为了获得更好的主观质量,我们使用了一种加权主观和客观指标的损失函数,并在我们的数据平台上使用大规模数据训练,最终可以在大赛中斩获了MOS和MS-SSIM的第一名。

TucodecTNGcnn4p算法完整的框架包括CNN编码、量化、反量化、CNN解码器、熵编码、码字估计、码率-失真优化等几个模块。


 

图鸭科技图片压缩研发团队,由国内多名从事计算机视觉、图像视频编解码和深度学习的博士们组成。团队从16年开始专注于图像视频算法研究,在17年开始专攻深度学习学习方向的压缩算法。打破传统压缩算法,采用基于端到端的深度学习算法架构新的图片编解码框架。致力于成为下一个图像视频压缩标准。