IJCV收录!深度去模糊综述论文来了

机器之心专栏

机器之心编辑部

本文提出了一个图像去模糊方向的综述,来自澳大利亚国立大学、中山大学、美国加州大学 Merced 分校、日本乐天研究所的研究者回顾了基于深度学习的图像去模糊技术研究进展,回顾了图像去模糊的研究历史,总结了当前的研究进展,并进行了展望。该综述近期被计算机视觉旗舰期刊 International Journal of Computer Vision 接收。

链接:https://link.springer.com/article/10.1007/s11263-022-01633-5

图像去模糊是计算机底层视觉中的一个经典问题,它的目标是将输入的模糊图像中恢复成清晰的图像。近些年,基于深度学习的神经网络在该任务上取得了重大进展。本文对最近发表的基于深度学习的图像去模糊方法进行了全面的回顾,主要看点如下:

1. 阐述图像去模糊的研究背景,包括如何定义去模糊、模糊产生的原因、去模糊的方法、质量评估的指标、常见的数据集。

2. 讨论了近些年基于深度学习在图像去模糊领域中取得的进展,对当前的深度去模糊方法进行全面回顾。

3. 分析了当前图像去模糊存在的挑战以及未来的研究课题。

背景知识

图像模糊是由拍摄图像过程中的各种因素引起,包括相机抖动、目标运动以及离焦等。根据模糊图片的不同,一般将模糊图片分为如下几类:运动模糊,离焦模糊,高斯模糊,以及混合模糊。

(1)运动模糊:在光照充足的条件下,当曝光时间足够短时,相机可以捕捉到清晰的图像。但是,当曝光时间相对于物体或者相机运动过长的时候,图像会产生模糊,该模糊图片一般被称为运动模糊。

(2)离焦模糊:除了运动模糊之外,图像清晰度还受到目标位置以及相机焦距的影响。在相机的成像区域中,不同目标的景深是不同的,当相机的对焦系统无法对焦到某些目标时,相机就会拍摄到离焦模糊的图片。

(3)高斯模糊:高斯模糊是通过高斯卷积得到的一种模糊图像。

(4)混合模糊:当一个图片同时被多种因素影响时,造成的模糊就是混合模糊,比如相机拍摄在离焦状态下的高速运动物体时,得到的模糊就是一种混合模糊。

为了评估去模糊的效果,通常采用一些图片评估算法,这些算法包括基于主观和基于客观的评测。主观方法是不需要清晰图像作参考的,一个具有代表性的指标是 MOS,评测者用 1-5 的等级对图像质量进行评分,之后对分数进行平均。对于图像去模糊的问题,大多数现有方法都是根据基于客观的指标进行评测,该方法可以进一步分为两类:有参考和无参考的指标。有参考的指标通过将恢复的图像与清晰图进行比较来评估图像质量,包括 PSNR,SSIM, WSNR, MS-SSIM、IFC、NQM、UIQI、VIT、LPIPS 等等,其中 PSNR 跟 SSIM 是最常用的指标。

与有参考的指标不同,无参考指标仅使用去模糊的图像就可以衡量其质量。常见的指标包括 BIQI、BLINDS、BRISQUE、CORNIA、NIQE、SSEQ 等。此外,也有人通过测量去模糊算法对不同视觉任务(例如目标检测和识别)准确性的影响,来评估图像去模糊算法的性能。

非盲图像去模糊

图像去模糊的任务是根据给定的模糊图像,恢复潜在的清晰图像。当已知图片模糊核的情况下,则该问题也可以被称为非盲图像去模糊。尽管已知了模糊核,但是由于传感器噪声和高频信息的丢失,该任务仍然具有挑战性。

一些基于非深度学习的方法通常使用自然图像先验,例如全局或者局部图像先验,在空间域 或频域中重建清晰的图像。为了恢复出更好的图片,近些年,一些基于空间反卷积和深度神经网络的方法相继被提出。本文在下面表格中总结了现有的基于深度学习的非盲方法,这些方法可以大致分为两组:第一组是基于反卷积去噪,而第二组是基于先验去噪声:

盲图像去模糊

当模糊图的模糊核未知时,图像去模糊任务被称为盲图像去模糊。早期的盲图像去模糊方法侧重于去除均匀的模糊核。然而,真实世界的模糊图像,其不同区域通常是由不同的模糊核生成,因此其模糊核是非均匀的。为了解决盲图像的去模糊任务,多种基于深度学习的图像去模糊算法被提出。本文在下面表格中总结了现有的基于深度学习的盲图像去模糊方法,这些方法通常采用各种不同的网络框架,包括多尺度网络、对抗神经网络、级联网络、再模糊网络等等。

损失函数

为了更好的训练深度去模糊网络,各种各样的损失函数被提出。早期的方法大部分是基于像素级内容的损失函数,用于测量网络训练过程中的去模糊图片跟清晰图片的重建误差。考虑到像素级内容的损失不能准确衡量去模糊图像的质量,各种其他的损失函数被提出,包括基于对抗的损失函数、基于感知的损失函数、基于相对模糊的损失函数、基于光流的损失函数等等。

模型性能对比

本本总结了具有代表性的图像去模糊跟视频去模糊算法在主流数据集上的 PSNR/SSIM 指标。

此外,本文总结了不同损失函数对去模糊方法的影响,模型在 non-reference 的评价指标上的表现,以及模型的速度。

特定场景的图像去模糊

当前,绝大部分基于深度学习的图像去模糊算法是不区分场景的,也就是他们是对常见的自然与人为设计的场景进行去模糊。但是,在现实生活中,经常会遇到一些特定场景的图像去模糊。比如人脸去模糊、文本去模糊、双目去模糊。本文总结了这些不同场景的特点,以及各自的深度去模糊算法。

机遇与挑战

尽管图像去模糊算法在主流数据集上取得了重大进展,但把真实世界的模糊图恢复成清晰的图像仍然具有挑战性。本文最后总结了图像去模糊算法现在面临的挑战并讨论了未来可能的研究机会,包括真实数据采集、损失函数、评价指标、模型规模、无监督学习等等。

感兴趣的读者可以阅读论文原文,了解更多研究细节。

原文地址:https://www.toutiao.com/article/7152801272163353088/

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


学习编程是顺着互联网的发展潮流,是一件好事。新手如何学习编程?其实不难,不过在学习编程之前你得先了解你的目的是什么?这个很重要,因为目的决定你的发展方向、决定你的发展速度。
IT行业是什么工作做什么?IT行业的工作有:产品策划类、页面设计类、前端与移动、开发与测试、营销推广类、数据运营类、运营维护类、游戏相关类等,根据不同的分类下面有细分了不同的岗位。
女生学Java好就业吗?女生适合学Java编程吗?目前有不少女生学习Java开发,但要结合自身的情况,先了解自己适不适合去学习Java,不要盲目的选择不适合自己的Java培训班进行学习。只要肯下功夫钻研,多看、多想、多练
Can’t connect to local MySQL server through socket \'/var/lib/mysql/mysql.sock问题 1.进入mysql路径
oracle基本命令 一、登录操作 1.管理员登录 # 管理员登录 sqlplus / as sysdba 2.普通用户登录
一、背景 因为项目中需要通北京网络,所以需要连vpn,但是服务器有时候会断掉,所以写个shell脚本每五分钟去判断是否连接,于是就有下面的shell脚本。
BETWEEN 操作符选取介于两个值之间的数据范围内的值。这些值可以是数值、文本或者日期。
假如你已经使用过苹果开发者中心上架app,你肯定知道在苹果开发者中心的web界面,无法直接提交ipa文件,而是需要使用第三方工具,将ipa文件上传到构建版本,开...
下面的 SQL 语句指定了两个别名,一个是 name 列的别名,一个是 country 列的别名。**提示:**如果列名称包含空格,要求使用双引号或方括号:
在使用H5混合开发的app打包后,需要将ipa文件上传到appstore进行发布,就需要去苹果开发者中心进行发布。​
+----+--------------+---------------------------+-------+---------+
数组的声明并不是声明一个个单独的变量,比如 number0、number1、...、number99,而是声明一个数组变量,比如 numbers,然后使用 nu...
第一步:到appuploader官网下载辅助工具和iCloud驱动,使用前面创建的AppID登录。
如需删除表中的列,请使用下面的语法(请注意,某些数据库系统不允许这种在数据库表中删除列的方式):
前不久在制作win11pe,制作了一版,1.26GB,太大了,不满意,想再裁剪下,发现这次dism mount正常,commit或discard巨慢,以前都很快...
赛门铁克各个版本概览:https://knowledge.broadcom.com/external/article?legacyId=tech163829
实测Python 3.6.6用pip 21.3.1,再高就报错了,Python 3.10.7用pip 22.3.1是可以的
Broadcom Corporation (博通公司,股票代号AVGO)是全球领先的有线和无线通信半导体公司。其产品实现向家庭、 办公室和移动环境以及在这些环境...
发现个问题,server2016上安装了c4d这些版本,低版本的正常显示窗格,但红色圈出的高版本c4d打开后不显示窗格,
TAT:https://cloud.tencent.com/document/product/1340