改进的多尺度学习字典图像去噪算法*

2023-08-02 07:08毛静

计算机与数字工程 2023年4期

毛静

（安康学院电子与信息工程学院安康 725000）

1 引言

目前，为有效去除图像噪声，尽可能保持图像结构的边缘/纹理等细节信息，多种去噪方法被应用于图像去噪工作中。例如空间域的中值滤波方法［1～2］、高斯滤波方法［3］、非局部均值滤波方法［4］、双边滤波方法［5］等，以及变换域的小波阈值方法［6］、奇异值分解方法［7］、曲波变换方法［8］和BM3D 算法［9］等。然而空间域去噪方法受原理限制，对于复杂图像中噪声去除较为困难。而变换域去噪方法对变换域系数做经验性假设，单一固定的基函数难以自适应复杂图像特征，容易损伤图像特征的细节信息，使图像变得模糊，部分算法虽然具有较好的去噪能力，但是受算法原理限制，其计算效率有待进一步提高。因而，数字图像需要一种能够既能较好消除图像噪声，又能最大程度保留图像边缘/纹理细节信息的高效率噪声去除方法［10］。

近年来，数字图像领域去噪方法较多，杨培在2018 年提出多信息结合字典方法，用于改善常规字典学习方法容易导致去噪结果模糊的问题［11］，由于算法抗干扰能力较差，去噪结果有待提升。陶永鹏等人在2019 年将字典学习和变分模型相融合，能够较好提升结果图像的结构相似性［12］，然而对于噪声较强时去噪效果较差。朱路等在2020 年提出一种梯度域非参数的贝叶斯字典学习方法，对于图像细节保护较好［13］，然而算法最优的模型参数较难确定，使得去噪结果不够理想。曲波变换具有方向性、多尺度性特征，能够较好地表示信号的局部特征，然而合适阈值的确定较为困难，去噪结果有待提升。针对上述情况，本文结合K-SVD 算法和曲波变换的优势，对K-SVD 算法的字典训练和构建方式进行改进，在曲波域构建多尺度学习字典，克服单一尺度进行图像稀疏表示的局限性，使得新的字典具有多尺度分析优点，进而能够自适应、完整细致地表达图像有效信息。经一系列仿真模拟证实，改进的去噪算法能够有效提升去噪效果，对图像的边缘/纹理等细节保护较好，图像质量提升明显。

2 曲波变换与字典学习原理

2.1 曲波变换

曲波变换最初由Candès 等提出［14］，先后经历两次发展。目前应用较广的是第二代曲波变换，其表达式为

式中，j，l，k 分别表示尺度，角度以及位置参数，f 表示目标函数，φj，l，k表示曲波函数，则频率域的表达式为

经过曲波变换后，曲波系数可以分为大尺度系数层、中尺度系数层和精细小尺度层，其中少数大尺度的曲波系数对应图像有效信号，而噪声信号混杂在中、小尺度的曲波系数中［15］。以大小为256×256的图像为例，曲波变换后，其曲波系数分为5个尺度，其尺度、方向等信息如表1所示。

表1 256×256图像的尺度系数及其结构信息

对式（1）的曲波系数进行阈值，摒弃噪声信号对应的小值系数，保留有效信号对应的大值系数，最后通过曲波反变换重构有效信号即可获取去噪结果。

2.2 K-SVD字典学习算法

K-SVD 算法主要包括稀疏编码和字典更新两个步骤，对于给定的原始无噪图像I，含噪图像X，设定学习字典D，则图像的稀疏表示去噪可以表示为一个最优问题，其表达式为

在求解式（4）时，需要设置一个初始学习字典D0={dk

0;k=1，2，…，K}，该初始字典通常为随机矩阵或者离散余弦变换系数组成，其中k 为迭代次数。然后计算稀疏编码系数，则更新后的稀疏表示系数公式为

使用最小角回归算法（Least angle regression，LARS）求解上式，得到图像的稀疏表示系数，则更新后的字典公式为

将式（7）改写为矩阵形式，则去噪后的图像表达式为

式中，E表示单位矩阵，Î表示去噪后图像结果。

由于图像有效信号具有良好的稀疏性，而噪声不具备这一特点，根据这一特征，K-SVD 通过重构图像的稀疏表示信号实现效信号和噪声信号分离目的。

3 多尺度学习字典的去噪算法

本文在综合考虑曲波变换和K-SVD 算法的基础上，提出基于多尺度特征的学习字典去噪算法，该算法综合曲波变换和K-SVD 算法优势，能有效提升去噪效果和边缘/纹理等细节保护能力，算法原理如下。

3.1 曲波变换及阈值预处理

对输入图像进行离散曲波变换，对不同尺度的曲波系数进行阈值处理并更新，则更新后的系数为

式中，x 表示更新后的曲波系数，c 表示更新前的曲波系数，Hτ表示阈值函数，j，l，k 分别表示尺度，角度以及位置参数。本文采用改进的Bayes软阈值算法对曲波系数进行噪声系数预处理，则各尺度条件下的阈值计算步骤为

1）估计各尺度条件下的噪声方差σ2

2）估计图像曲波系数方差σx2

则最终的阈值表达式为

然而，真实的噪声方差很难估计，通常需要多次调试才能得到可靠阈值参数，因此本文建立一个稀疏反演模型，用于求解最优阈值。

首先建立一个含噪的模型，其表达式为

其中，x表示有效图像信息，n 表示噪声信息，φj，l，k表示曲波函数，c 表示曲波系数。当噪声信息σ已知时，可以求解式（14）获取图像的有效信息x，从而实现噪声去除，其表达式为

式中，σ表示噪声方差，由于很难估计到实际图像的真实噪声情况，因此本文建立一个稀疏反演模型用于求解，其表达式为

式中，λ为正则化参数，求解式（15）得去噪后的有效信息。

实现上述目的的重点在于如何确定合适最优的正则化参数，通常情况下，当图像中含有较弱的噪声时，选取较小的λ值即可；当含有较强噪声时，需要选取较大的λ值，且只有选取的λ最优时，才能取得最好的去噪效果。因此，对于不同尺度下的曲波系数，要选取不同的λ才能有效去除该尺度下的噪声信息。

对于式（15），本文采用一种改进迭代逼近的软阈值方法求取正则化参数λ，即首先应用一个较大的λ参数求解式（15）得到下一次迭代的初始解，然后逐步减小正则化参数λ并求解直至获取最优的正则化参数，为实现自适应阈值求取，本文定义一个中间变量参数，其公式为

由式（16）可知，随着正则化参数逐渐减小，‖xk‖1逐渐增大，‖ ＜x，φj，l，k＞-c(j，l，k)‖2也逐渐减小，则中间变量参数Pk先变大后减小，实验表明，只有当Pk为极大值时，所对应的阈值即为最优阈值。

3.2 在线字典的初始化

按照稀疏表示理论将式（12）中的每一个尺度的曲波系数矩阵按照既定规格分割为n 块，每一小块数据成为一个样本xi，在进行字典学习前，每一层曲波系数设置一个初始学习字典，则在当前尺度、角度和位置下的初始字典可以设置为D(j，l，k)0={dt0;

t=1，2，…，K}，其中t 为迭代次数，通常将该初始字典设置为一个随机矩阵。

为避免稀疏表示系数矩阵中出现小值，通常对该初始字典列向量的二范数进行约束，则约束公式为

式中，∅表示字典矩阵的凸集，Rm×k表示m×k的实数矩阵，dt表示字典矩阵的列向量，dT t表示字典矩阵的列向量的转置。

3.3 在线字典的学习和更新

1）循环进行稀疏编码

根据式（5），使用LARS计算稀疏编码系数。

式中，αt表示当前循环次数下计算得到的稀疏系数，xt表示当前循环次数下的曲波系数矩阵，α表示原始含噪图像的曲波系数x(j，l，k)的稀疏系数，m表示设定的循环次数。

2）中间量更新

At为中间变量，且A=[a1，a2，…，ak]∈Rk×k，其目的在于方便字典更新，通常设置初始量为零矩阵。在每次迭代过程中，当前循环次数的数据块xt矩阵中包含由η个有效信号xt1，xt2，…，xtη，则迭代更新后为

式中，

定义中间变量Bt，且Bt=[b1，b2，…，bk]∈Rm×k，通常设置初始量为零矩阵。在每次迭代过程中，当前循环次数的数据块xt矩阵中包含由η个有效信号，则迭代更新量为

3）字典更新

采用式（20）和式（21）完成字典的更新，则当前迭代次数t的字典为

对式（22）进行求解，两边对D 求导，则式（22）变为

式中，E 为单位矩阵，At为对称矩阵，则式（23）可继续推导为

以字典的列向量为目标，进行逐列求导，则式（24）变为

将式（25）与牛顿迭代法结合，则得到字典的第m列更新值：

将上述更新值进行归一化处理，则最终的第m列更新后字典值为

循环结束，得到当前尺度、角度和位置的最终字典DT(j，l，k)。

3.4 去噪处理

最后将稀疏系数αt和最终字典DT相乘，去噪后的曲波系数AT为

3.5 曲波逆变换

对上述曲波系数进行叠加并执行曲波逆变换，则得到最终处理后的图像结果，其逆变换公式为

4 算法测试与应用

为验证本文算法，本文采用含加性噪声的标准灰度图像进行测试。原始无噪图像和含噪图像如图1所示，然后采用K-SVD算法、双边滤波方法、非局部均值滤波方法、曲波变换算法、BM3D 算法、文献［10］方法、文献［11］方法、文献［12］方法以及本文方法进行测试。将图1（b）所示的含噪图像作为输入图像，对不同方法去噪结果的峰值信噪比（Peak Signal to Noise Ratio，PSNR）和结构相似度（Structural similarity，SSIM）值进行统计，结果见表2。

图1 原始无噪图像和含噪图

表2 仿真结果的峰值信噪比-结构相似度

由表2 可知，45 组测试结果中，K-SVD 结果的PSNR 平均提升为39.7%，SSIM 平均提升0.36；双边滤波结果的PSNR 平均提升为45.5%，SSIM 平均提升0.38；非局部均值滤波结果的PSNR 平均提升为49%，SSIM 平均提升0.394；曲波变换结果的PSNR平均提升50.1%，SSIM 平均提升0.402；BM3D 结果的PSNR 平均提升56.62%，SSIM 平均提升0.442；文献［10］方法结果的PSNR 平均提升52%，SSIM 平均提升0.406；文献［11］方法结果的PSNR 平均提升53.7%，SSIM 平均提升0.418；文献［12］方法结果的PSNR 平均提升54.8%，SSIM 平均提升0.424；本文方法的PSNR 平均提升56.6%，SSIM 平均提升0.436。上述结果中，具有最高PSNR 和SSIM 的一组结果是BM3D 方法产生，本文方法和BM3D 结果最为接近。

然后将图1（d）所示的含噪图像采用不同方法去噪，九种处理结果如图2 所示。为详细分析细节保持情况，对图2 中的方框区域图像进行放大显示，放大结果位于各自图像的左上角位置。

图2 不同去噪方法的测试结果图

由图2 可知，K-SVD 方法去噪结果中，图像边缘信息较为模糊，纹理细节有所损伤；双边滤波结果中，出现“振铃”现象；非局部均值去噪结果，去噪程度较好，但是边缘较模糊；曲波变换去噪效果要稍好于K-SVD 结果、双边滤波结果和非局部均值结果，但是去噪结果的局部细节仍旧有所模糊，存在部分“线状”噪声，具体如图2（d）。文献［10］方法结果、文献［11］方法结果和文献［12］方法结果，相对上述四种方法结果而言，图像质量明显较好，但是相对BM3D 方法和本文方法结果而言，其图像局部细节的质量依然存在模糊或者存在“振铃”现象。本文方法的处理结果和BM3D 结果最好，两种方法结果中的边缘/纹理细节保持较好，图像整体与原始无噪图像最为接近，具体如图2（e）、图2（i）所示。

5 结语

本文结合K-SVD 方法的自适应性以及曲波变换多尺度、方向性优势，提出改进的多尺度学习字典去噪算法，通过标准灰度图像测试，证实本文方法具有很好的去噪能力和边缘/纹理等细节保持效果。相比较常规算法而言，效果较好，去噪结果和BM3D 结果最为接近，去噪能力和BM3D 方法几乎一致。但是计算效率明显优于BM3D 方法，在图像处理中具有一定的推广应用效果。