Distilling Image Dehazing with Heterogeneous Task Imitation

1,807 阅读2分钟

CVPR 2020

Ming Hong, Yuan Xie, Cuihua Li, Yanyun Qu

简介

文章使用知识蒸馏方法设计了去雾网络。教师网络为自编码器对无雾图像进行恢复,学生网络为端到端的去雾网络对有雾图像进行去雾。其中教师网络的编码特征为指导信息指导学生网络的中间结果与自编码器网络相似。

Motivation

文章提出了三个问题:

  • 对于去雾任务,什么样的网络可以提供有效的知识来辅助去雾网络进行训练?现有的大部分知识蒸馏方法是让老师网络和学生网络处理相同的任务,很少有人研究不同任务之间的知识迁移。异构任务是否有助于深度去雾模型的训练?
  • 教师网络如何帮助学生网络训练?大多数知识蒸馏方法侧重于结果导向的学习,而忽略了过程导向的学习。所以,该如何利用中间层特征培养学生?
  • 如何衡量老师和学生之间的相似性?在图像分类中,利用类的分布来衡量师生之间的相似性。而对图像增强,没有相应的类信息可以使用。

Model

如图所示,Teacher网络为一个自编码器网络,网络负责对输入图像重建。Dehazing网络(学生网络)负责去雾,其中每个模块卷积完的特征要和教师网络的残差块特征保持一致。其中SWRCAB模块如下图所示

损失函数

自编码器网络使用了L_1损失。 去雾网络使用了L_1损失、感知损失(VGG损失)、中间特征的L_1损失。 文章特地为中间特征的L_1损失添加了相关的权重,具体表现为:

两张权重图\Psi_1\Psi_2分别为传输图t和有雾图减去无雾图,他们负责评估雾的浓度(而有些数据集中缺乏传输图t,因此使用有雾图减去无雾图代替)。norm(\cdot)表示归一化操作。T^m(J)g(S^n(I))为学生网络和教师网络得到的编码信息。

数据和训练

数据集

  • RESIDE(ITS)

  • NTIRE 2018 O-HAZE

训练设置

  • 训练教师网络30轮
  • 训练学生网络60轮
  • 使用Adam优化器
  • 初始学习率10^{-4}

对比和测试

测试指标

指标对比

结果展示