文献综述
1 研究背景
计算机视觉(Computer vision)是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图像处理,用计算机处理成为更适合人眼观察或传送给仪器检测的图像。作为一门科学学科,计算机视觉研究相关的理论和技术,试图创建能够从图像或者多维数据中获取“信息”的系统。近年来,随着计算机、互联网、通信技术的迅速发展,每天都有海量的图像数据产生,处理这些图像数据并从中得到相关信息变得愈发重要。
图像的超分辨率重建以及图像色彩增强是提高图像质量的有效手段,对加强图像判读识别效果、改善图像观感有着至关重要的意义,在计算机视觉领域有着举足轻重的地位。图像超分辨率(super-resolution,SR)是指利用算法将图像从低分辨率(low resolution,LR)恢复到高分辨率(high resolution,HR)的过程,是计算机视觉和图像处理的重要技术之一[1]。对图像进行超分辨率重建有助于图像的进一步处理,在医学成像,目标检测等领域有着广泛的应用。而图像增强是指增强图像中的有用信息,它可以是一个失真的过程,目的是针对给定图像的应用场合改善图像的视觉效果。其中,对图像进行色彩增强和修饰有助于提升图像的显示效果,在相机、图片编辑工具以及屏幕显示是不可缺少的一环。
2 图像超分辨率重建技术研究现状
图像超分辨率技术根据输入图像数量的不同可分为多图像、视频和单图像超分辨率[2]。其中,单图像超分辨率技术由于具有较高的应用价值,一直是超分辨率技术研究中重点。依据算法的不同,单图像超分辨率可以分为三类:基于插值的方法、基于重建的方法、基于学习的方法。
2.1 基于插值的超分辨率算法
基于插值的单图像超分辨率算法利用基函数或插值核来逼近损失的图像高频信息,从而实现图像的重建。这是一种基础的图像超分辨率算法,其特点是简单直观,复杂度低,但是效果较为有限。典型的算法有最近邻插值、双线性插值和双三次插值。Key是双三次差值算法[3]的提出者,这种算法随后被不同领域所应用,至今仍是一种重要的插值方法。Mallat提出了小波的快速分解与重构算法[4], 利用两个一维滤波器对二维图像实现快速小波分解, 再利用分解时的两个一维滤波器的镜像滤波器来实现图像的重构。由于边缘对人眼知觉系统的视觉重要性,研究者提出了边缘引导的图像插值方法[5]来对图像边缘进行放大。Dong和Romano等人利用了基于稀疏表示的方法来对图像插值实现图像超分辨率[6-7]。Wang等人采用先插值后修改的策略增强图像的视觉效果,提高相邻图像区域间的颜色或亮度的过渡[8]。
2.2 基于重建的超分辨率方法
