改进的多尺度学习字典图像去噪算法*

2023-08-02 07:08
计算机与数字工程 2023年4期
关键词:曲波字典尺度

毛 静

(安康学院电子与信息工程学院 安康 725000)

1 引言

目前,为有效去除图像噪声,尽可能保持图像结构的边缘/纹理等细节信息,多种去噪方法被应用于图像去噪工作中。例如空间域的中值滤波方法[1~2]、高斯滤波方法[3]、非局部均值滤波方法[4]、双边滤波方法[5]等,以及变换域的小波阈值方法[6]、奇异值分解方法[7]、曲波变换方法[8]和BM3D 算法[9]等。然而空间域去噪方法受原理限制,对于复杂图像中噪声去除较为困难。而变换域去噪方法对变换域系数做经验性假设,单一固定的基函数难以自适应复杂图像特征,容易损伤图像特征的细节信息,使图像变得模糊,部分算法虽然具有较好的去噪能力,但是受算法原理限制,其计算效率有待进一步提高。因而,数字图像需要一种能够既能较好消除图像噪声,又能最大程度保留图像边缘/纹理细节信息的高效率噪声去除方法[10]。

近年来,数字图像领域去噪方法较多,杨培在2018 年提出多信息结合字典方法,用于改善常规字典学习方法容易导致去噪结果模糊的问题[11],由于算法抗干扰能力较差,去噪结果有待提升。陶永鹏等人在2019 年将字典学习和变分模型相融合,能够较好提升结果图像的结构相似性[12],然而对于噪声较强时去噪效果较差。朱路等在2020 年提出一种梯度域非参数的贝叶斯字典学习方法,对于图像细节保护较好[13],然而算法最优的模型参数较难确定,使得去噪结果不够理想。曲波变换具有方向性、多尺度性特征,能够较好地表示信号的局部特征,然而合适阈值的确定较为困难,去噪结果有待提升。针对上述情况,本文结合K-SVD 算法和曲波变换的优势,对K-SVD 算法的字典训练和构建方式进行改进,在曲波域构建多尺度学习字典,克服单一尺度进行图像稀疏表示的局限性,使得新的字典具有多尺度分析优点,进而能够自适应、完整细致地表达图像有效信息。经一系列仿真模拟证实,改进的去噪算法能够有效提升去噪效果,对图像的边缘/纹理等细节保护较好,图像质量提升明显。

2 曲波变换与字典学习原理

2.1 曲波变换

曲波变换最初由Candès 等提出[14],先后经历两次发展。目前应用较广的是第二代曲波变换,其表达式为

式中,j,l,k 分别表示尺度,角度以及位置参数,f 表示目标函数,φj,l,k表示曲波函数,则频率域的表达式为

经过曲波变换后,曲波系数可以分为大尺度系数层、中尺度系数层和精细小尺度层,其中少数大尺度的曲波系数对应图像有效信号,而噪声信号混杂在中、小尺度的曲波系数中[15]。以大小为256×256的图像为例,曲波变换后,其曲波系数分为5个尺度,其尺度、方向等信息如表1所示。

表1 256×256图像的尺度系数及其结构信息

对式(1)的曲波系数进行阈值,摒弃噪声信号对应的小值系数,保留有效信号对应的大值系数,最后通过曲波反变换重构有效信号即可获取去噪结果。

2.2 K-SVD字典学习算法

K-SVD 算法主要包括稀疏编码和字典更新两个步骤,对于给定的原始无噪图像I,含噪图像X,设定学习字典D,则图像的稀疏表示去噪可以表示为一个最优问题,其表达式为

在求解式(4)时,需要设置一个初始学习字典D0={dk

0;k=1,2,…,K},该初始字典通常为随机矩阵或者离散余弦变换系数组成,其中k 为迭代次数。然后计算稀疏编码系数,则更新后的稀疏表示系数公式为

使用最小角回归算法(Least angle regression,LARS)求解上式,得到图像的稀疏表示系数,则更新后的字典公式为

将式(7)改写为矩阵形式,则去噪后的图像表达式为

式中,E表示单位矩阵,Î表示去噪后图像结果。

由于图像有效信号具有良好的稀疏性,而噪声不具备这一特点,根据这一特征,K-SVD 通过重构图像的稀疏表示信号实现效信号和噪声信号分离目的。

3 多尺度学习字典的去噪算法

本文在综合考虑曲波变换和K-SVD 算法的基础上,提出基于多尺度特征的学习字典去噪算法,该算法综合曲波变换和K-SVD 算法优势,能有效提升去噪效果和边缘/纹理等细节保护能力,算法原理如下。

3.1 曲波变换及阈值预处理

对输入图像进行离散曲波变换,对不同尺度的曲波系数进行阈值处理并更新,则更新后的系数为

式中,x 表示更新后的曲波系数,c 表示更新前的曲波系数,Hτ表示阈值函数,j,l,k 分别表示尺度,角度以及位置参数。本文采用改进的Bayes软阈值算法对曲波系数进行噪声系数预处理,则各尺度条件下的阈值计算步骤为

1)估计各尺度条件下的噪声方差σ2

2)估计图像曲波系数方差σx2

则最终的阈值表达式为

然而,真实的噪声方差很难估计,通常需要多次调试才能得到可靠阈值参数,因此本文建立一个稀疏反演模型,用于求解最优阈值。

首先建立一个含噪的模型,其表达式为

其中,x表示有效图像信息,n 表示噪声信息,φj,l,k表示曲波函数,c 表示曲波系数。当噪声信息σ已知时,可以求解式(14)获取图像的有效信息x,从而实现噪声去除,其表达式为

式中,σ表示噪声方差,由于很难估计到实际图像的真实噪声情况,因此本文建立一个稀疏反演模型用于求解,其表达式为

式中,λ为正则化参数,求解式(15)得去噪后的有效信息。

实现上述目的的重点在于如何确定合适最优的正则化参数,通常情况下,当图像中含有较弱的噪声时,选取较小的λ值即可;当含有较强噪声时,需要选取较大的λ值,且只有选取的λ最优时,才能取得最好的去噪效果。因此,对于不同尺度下的曲波系数,要选取不同的λ才能有效去除该尺度下的噪声信息。

对于式(15),本文采用一种改进迭代逼近的软阈值方法求取正则化参数λ,即首先应用一个较大的λ参数求解式(15)得到下一次迭代的初始解,然后逐步减小正则化参数λ并求解直至获取最优的正则化参数,为实现自适应阈值求取,本文定义一个中间变量参数,其公式为

由式(16)可知,随着正则化参数逐渐减小,‖xk‖1逐渐增大,‖ <x,φj,l,k>-c(j,l,k)‖2也逐渐减小,则中间变量参数Pk先变大后减小,实验表明,只有当Pk为极大值时,所对应的阈值即为最优阈值。

3.2 在线字典的初始化

按照稀疏表示理论将式(12)中的每一个尺度的曲波系数矩阵按照既定规格分割为n 块,每一小块数据成为一个样本xi,在进行字典学习前,每一层曲波系数设置一个初始学习字典,则在当前尺度、角度和位置下的初始字典可以设置为D(j,l,k)0={dt0;

t=1,2,…,K},其中t 为迭 代 次数,通常将该初始字典设置为一个随机矩阵。

为避免稀疏表示系数矩阵中出现小值,通常对该初始字典列向量的二范数进行约束,则约束公式为

式中,∅表示字典矩阵的凸集,Rm×k表示m×k的实数矩阵,dt表示字典矩阵的列向量,dT t表示字典矩阵的列向量的转置。

3.3 在线字典的学习和更新

1)循环进行稀疏编码

根据式(5),使用LARS计算稀疏编码系数。

式中,αt表示当前循环次数下计算得到的稀疏系数,xt表示当前循环次数下的曲波系数矩阵,α表示原始含噪图像的曲波系数x(j,l,k)的稀疏系数,m表示设定的循环次数。

2)中间量更新

At为中间变量,且A=[a1,a2,…,ak]∈Rk×k,其目的在于方便字典更新,通常设置初始量为零矩阵。在每次迭代过程中,当前循环次数的数据块xt矩阵中包含由η个有效信号xt1,xt2,…,xtη,则迭代更新后为

式中,

定 义 中 间 变 量Bt,且Bt=[b1,b2,…,bk]∈Rm×k,通常设置初始量为零矩阵。在每次迭代过程中,当前循环次数的数据块xt矩阵中包含由η个有效信号,则迭代更新量为

3)字典更新

采用式(20)和式(21)完成字典的更新,则当前迭代次数t的字典为

对式(22)进行求解,两边对D 求导,则式(22)变为

式中,E 为单位矩阵,At为对称矩阵,则式(23)可继续推导为

以字典的列向量为目标,进行逐列求导,则式(24)变为

将式(25)与牛顿迭代法结合,则得到字典的第m列更新值:

将上述更新值进行归一化处理,则最终的第m列更新后字典值为

循环结束,得到当前尺度、角度和位置的最终字典DT(j,l,k)。

3.4 去噪处理

最后将稀疏系数αt和最终字典DT相乘,去噪后的曲波系数AT为

3.5 曲波逆变换

对上述曲波系数进行叠加并执行曲波逆变换,则得到最终处理后的图像结果,其逆变换公式为

4 算法测试与应用

为验证本文算法,本文采用含加性噪声的标准灰度图像进行测试。原始无噪图像和含噪图像如图1所示,然后采用K-SVD算法、双边滤波方法、非局部均值滤波方法、曲波变换算法、BM3D 算法、文献[10]方法、文献[11]方法、文献[12]方法以及本文方法进行测试。将图1(b)所示的含噪图像作为输入图像,对不同方法去噪结果的峰值信噪比(Peak Signal to Noise Ratio,PSNR)和结构相似度(Structural similarity,SSIM)值进行统计,结果见表2。

图1 原始无噪图像和含噪图

表2 仿真结果的峰值信噪比-结构相似度

由表2 可知,45 组测试结果中,K-SVD 结果的PSNR 平均提升为39.7%,SSIM 平均提升0.36;双边滤波结果的PSNR 平均提升为45.5%,SSIM 平均提升0.38;非局部均值滤波结果的PSNR 平均提升为49%,SSIM 平均提升0.394;曲波变换结果的PSNR平均提升50.1%,SSIM 平均提升0.402;BM3D 结果的PSNR 平均提升56.62%,SSIM 平均提升0.442;文献[10]方法结果的PSNR 平均提升52%,SSIM 平均提升0.406;文献[11]方法结果的PSNR 平均提升53.7%,SSIM 平均提升0.418;文献[12]方法结果的PSNR 平均提升54.8%,SSIM 平均提升0.424;本文方法的PSNR 平均提升56.6%,SSIM 平均提升0.436。上述结果中,具有最高PSNR 和SSIM 的一组结果是BM3D 方法产生,本文方法和BM3D 结果最为接近。

然后将图1(d)所示的含噪图像采用不同方法去噪,九种处理结果如图2 所示。为详细分析细节保持情况,对图2 中的方框区域图像进行放大显示,放大结果位于各自图像的左上角位置。

图2 不同去噪方法的测试结果图

由图2 可知,K-SVD 方法去噪结果中,图像边缘信息较为模糊,纹理细节有所损伤;双边滤波结果中,出现“振铃”现象;非局部均值去噪结果,去噪程度较好,但是边缘较模糊;曲波变换去噪效果要稍好于K-SVD 结果、双边滤波结果和非局部均值结果,但是去噪结果的局部细节仍旧有所模糊,存在部分“线状”噪声,具体如图2(d)。文献[10]方法结果、文献[11]方法结果和文献[12]方法结果,相对上述四种方法结果而言,图像质量明显较好,但是相对BM3D 方法和本文方法结果而言,其图像局部细节的质量依然存在模糊或者存在“振铃”现象。本文方法的处理结果和BM3D 结果最好,两种方法结果中的边缘/纹理细节保持较好,图像整体与原始无噪图像最为接近,具体如图2(e)、图2(i)所示。

5 结语

本文结合K-SVD 方法的自适应性以及曲波变换多尺度、方向性优势,提出改进的多尺度学习字典去噪算法,通过标准灰度图像测试,证实本文方法具有很好的去噪能力和边缘/纹理等细节保持效果。相比较常规算法而言,效果较好,去噪结果和BM3D 结果最为接近,去噪能力和BM3D 方法几乎一致。但是计算效率明显优于BM3D 方法,在图像处理中具有一定的推广应用效果。

猜你喜欢
曲波字典尺度
财产的五大尺度和五重应对
林海雪原(五)
林海雪原(三)
字典的由来
林海雪原(四)
曲波变换三维地震数据去噪技术
我是小字典
宇宙的尺度
正版字典
9