基于纹理免疫的JPEG 预压缩图像降尺度因子检测

2022-05-14 03:28党良慧张玉金路东生
计算机工程 2022年5期
关键词:插值直方图差分

党良慧,张玉金,路东生

(上海工程技术大学电子电气工程学院,上海 201620)

0 概述

被动取证相比主动取证,不需要水印、签名等过多额外信息,具有更广泛的应用前景[1-2]。在图像拼接篡改中,对局部拼接区域进行旋转、缩放等重采样处理可以使伪造图像在几何视角上更加逼真[3-4]。因此,检测局部图像区域是否经过重采样处理有助于定位篡改区域,重采样检测成为图像盲取证的重要手段[5-6]。

目前JPEG 图像是人们获取信息的主要来源之一。随着各种图像编辑工具的普及,JPEG 图像越来越容易被篡改[7]。对图像进行JPEG 压缩和重采样操作的方法主要有JPEG 后压缩图像重采样、JPEG预压缩图像重采样以及JPEG 双压缩图像重采样3 种组合[8-9]。在JPEG 后压缩图像重采样中,未被篡改的图像是无损压缩格式,篡改后的图像是JPEG 格式。在JPEG 预压缩图像重采样中,未篡改图像为JPEG 格式,篡改后的图像为无损压缩格式。对于JPEG 双压缩图像重采样,未篡改和篡改后的图像均为JPEG 格式。

KIRCHNER 等[10]发现JPEG 压缩会在频域产生峰值,并且峰值会根据重采样操作而移位。基于此理论,BIANCHI 等[11]提出通过检测移位的JPEG 峰来估计缩放因子。GALLAGHER[12]的研究发现,经历重采样操作的JPEG 图像,其频域主要有重采样峰、JPEG 峰和离散傅里叶变换(Discrete Fourier Transform,DFT)导致的对称JPEG 峰。传统的光谱分析法[13],无论是通过检测JPEG 峰值或是检测重采样峰值,均会被无关峰值所干扰。尤其当JPEG 图像经历下采样操作后,降尺度因子更加微弱,其峰值难以被检测。因此,LIU 等[14]引入秩统计理论并结合光谱分析进行JPEG 图像下采样因子的估计。

文献[14]研究发现,差分图像相邻极值之间的间隔服从几何分布,且分布直方图具有周期性。未经重采样的JPEG 图像的分布直方图以8 为周期进行变化,重采样后导致原本的周期发生改变,新的周期与重采样因子有关。因此,降尺度因子可以通过检测重采样操作后的差分图像极值直方图的周期进行估计,但对于JPEG 压缩质量较高和纹理丰富的图像来说,该方法检测准确率较低。本文分析影响检测结果的因素主要有图像纹理内容、图像边缘以及块效应强度。其中,由于极值直方图的检测主要在像素域内进行,图像中具有周期性变化的纹理内容会导致检测结果的混淆。而在像素域检测移位块效应的极值直方图时,图像周期性边缘会产生伪周期,干扰直方图估计的准确性。且JPEG 压缩质量因子越高,压缩块效应越不明显,极值直方图的检测越困难。如何有效地凸显块效应成为需要解决的难题。

与图像边缘和块效应强度相比,图像丰富的纹理特征对直方图提取的准确性干扰最明显。为了使降尺度因子估计更准确,需要对图像纹理进行分析。纹理是一种反映像素空间分布属性的图像特征,通过像素及其周围空间领域的灰度分布来表现,纹理具有重复性和规律性,其局部统计特征呈周期性变化[15]。导致直方图的统计特性分析产生混淆,影响降尺度因子估计的准确性。

本文提出一种纹理免疫块效应分析算法,分别引入快速导向滤波器和Canny 算子削弱图像纹理、周期性边缘的干扰,并寻找更有效的差分方式,凸显JPEG 图像移位的块效应网格(Shifted Block Artifact Grid,SBAG),减小估计误差。

1 相关工作

1.1 重采样图像光谱分析

本节主要介绍重采样模型以及图像重采样的光谱分析。为简化分析,在不失一般性的情况下,以一维信号为例进行重采样分析。根据文献[16]中的模型,以来表示重采样因子,对于给定的原始图像g0(n),n∈Z2,经过以下3 个步骤生成重采样图像。

步骤1重构。由原始离散序列g0(n)通过插值重新构建一个连续信号gh(x),如式(1)所示:

其中:h(x)为插值核函数。

步骤2变换。根据函数y=α(x)进行位置变换得到一个新的函数,如式(2)所示:

由于本节只考虑一维信号的缩放操作,令α(x)=λx,λ∈R+,因此可得gr(x)的表达式如式(3)所示:

其中:λ为需要检测的重采样因子。

步骤3采样。将第2 步得到的连续信号gr(x)通过重新采样得到重采样信号g1(n)=gr(n),结合式(1)~式(3)可知:

重采样模型建立后,对其进行光谱分析。在重采样模型中,步骤1 的插值操作引入了循环平稳性。为简化分析,考虑g0(n)为具有二阶矩过程的广义平稳信号,并引入方差来进行傅里叶域的峰值分析。从重采样模型的步骤1 中提取gh(x)的方差为νh(x)=sh(x)+rh(x),sh(x)和rh(x)的表达式如下:

其中:Var{}和Cov{}分别表示方差算子和协方差算子。

由于g0(n)是广义平稳信号,且插值核为能量有限函数,因此在光谱分析中可以忽略rh(x)的影响,只考虑sh(x)的光谱分析。假设Var{g0(i)}=,可以得到sh(x)的表达式如式(6)所示:

基于Dirac 函数Δ(x)=得到sh(x)的表达式如式(7)所示,其傅里叶变换如式(8)所示:

其中:Uh(ω)=H(ω) ×H(ω),H(ω)为插值核函数h(x)的傅里叶变换;Sh(ω)为sh(x)的傅里叶变换。

由式(8)可以看出其离散谱的峰值在整数点,插值核的傅里叶变换与插值核卷积的傅里叶变换分别如图1(a)、图1(b)所示。

图1 插值核函数卷积的傅里叶变换Fig.1 Fourier transform of the convolution of the interpolation kernel

根据重采样模型中的步骤2 的缩放操作引入重采样因子λ,sh(x)变为sr(x),sr(x)=的傅里叶变换如式(9)所示:

如图1 所示,|H(ω)×H(ω)|在R+内是单调递减的,即U(λω-j)是单调递减的,故谐波的阶数越高,其对应的峰值越弱。结合式(9)和式(10)可以推导出峰值的位置如式(12)所示:

由奈奎斯特抽样定理可知,当λ>2 即时,通常只有一阶谐波峰值ω1显示在S1(ω)。如果只考虑上采样的情况,一般重采样因子估计的方法是将频率在0.0~0.5 间的峰值作为一阶谐波峰值ω1,使用式(12)来估计重采样因子为对于下采样,通过式(11)可知M1(ω)与q成反比。因此,使用传统的光谱法进行峰值分析以检测下采样因子比较困难。

1.2 移位的块效应网格分析

对一幅图像进行JPEG 压缩的基本流程主要包括彩色空间转换、8×8 分块离散余弦变换、量化、Huffman 编码等步骤,解压缩是上述压缩步骤的逆过程。由于每个图像块都是被单独量化的,块内部区域比较平滑,而块与块之间的过渡较为剧烈。这种现象在整个图像的水平和垂直方向上周期性地出现,形成块效应网格(Block Artifact Grid,BAG)。压缩率越高,图像的质量越低,BAG 就越明显。

由上述分析可知,BAG 是由于JPEG 压缩而出现,且对一般的后处理操作具有鲁棒性[17]。为了分析重采样操作对BAG 的影响,对一幅大小为M×N的JPEG 压缩图像,本文采用文献[18]的方式给出其数学表达式:

其中:T为块效应网格的周期;δ(·)为Dirac-Delta函数。原始JPEG 图像块效应网格的周期性为8,以重采样因子λ操作后,其周期变为8λ。周期性的变化展现了重采样操作对BAG 的影响,当JPEG 图像经历重新采样改变大小时,BAG 以重采样比例变为SBAG。

在JPEG 预压缩的情况下,图像经历重采样操作后,原本的块效应网格发生移位,变为仅出现在8λ×8λ边界上的周期性信号,其周期取决于缩放因子λ,如图2 所示。其中压缩质量因子(Quality Factor,QF)值越大,表示JPEG 压缩得越厉害。结合秩统计理论[14]可知,对于未经过重采样的未压缩图像,其空间域内的相邻极值间隔分布直方图(Nf图)满足伯努利分布,如图2(a)所示。经过压缩的JPEG 图像由于BAG 的存在,导致原本的分布上产生周期为8 的峰值,如图2(c)所示。同时,经历过重采样后的JPEG图像,BAG 以重采样因子λ产生偏移,导致峰值的周期变为8λ,如图2(d)所示。而未压缩的图像经历重采样后无此规律,如图2(b)所示。

图2 不同图像的Nf图Fig.2 Different images of Nf diagram

通过以上分析可知,降尺度因子可通过检测直方图的统计特性进行估计。但是由于图像纹理噪声和边缘的干扰会导致Nf图产生伪周期,从而混叠峰值周期的检测。

2 本文算法

基于上述分析,图像纹理和边缘产生的伪周期会干扰降尺度因子估计的准确性,本文使用快速导向滤波对图像进行预处理来去除图像纹理和噪声的干扰,并利用Canny 算子对滤波后的图像进行边缘检测与去除。最后,对图像进行交叉差分,以凸显块效应,提高JPEG 图像降尺度因子估计的准确性。具体算法步骤如下:

1)读取一幅JPEG 图像;

2)对图像进行快速导向滤波去除纹理和噪声的干扰;

3)对去除纹理的图像使用Canny 算子进行边缘检测和去除;

4)对移除纹理和边缘的图像使用交叉差分凸显块效应;

5)计算差分图像的极值区间间隔直方图;

6)结合光谱法和最大似然估计法,估计直方图的峰值周期,并计算重采样因子。

2.1 快速导向滤波

导向图像滤波器具有保边平滑特性,且能避免双边滤波器所产生的梯度伪影[19]。本节对图像进行快速导向滤波来去除图像噪声和纹理的干扰,提高后续处理算法的检测性能。

导向滤波的思想是利用一张引导图像G产生权重,处理输入图像I,进而得到输出图像In。其中,G和I均为已知图像,两者可以是相同的。该过程如式(14)所示:

其中:(r,s)表示图像的像素点;(x,y)为其邻域像素点;Ω(r,s)表示像素点(r,s)的领域像素点的集合。可以看出式(14)中权重W仅与引导图像G有关,双边滤波中权重W由输入图像决定。

导向滤波器的核心是在引导图像G与输出图像In之间建立一个局部线性模型,在局部窗口wk中,输出图像与引导图像的线性关系如式(15)所示:

其中:ak和bk为窗口wk中假定为常数的线性系数。如图3 所示该模型可以保证输出图像In被引导图像G约束,由于∇In=a∇G,即当引导图像的局部有梯度变化时,输出图像也会产生相应的梯度变化。

图3 导向滤波模型Fig.3 Guided filtering model

本文目的是根据图像的参数来定义线性系数ak和bk,为了去除图像中的纹理、噪声等干扰因子,假设纹理噪声为T,本文将输出图像In定义如式(16)所示:

为了求解式(15)中的线性系数ak和bk,根据式(16),假设所需要的系数能够使输入图像I和输出图像In差异最小,在窗口wk中的代价函数可以表示为式(17):

其中:ε是正则化系数,可以通过最小二乘法得出该式子的解。

其中:μk和分别为引导图像G在窗口wk中的均值和方差;|w|表示窗口wk中像素的数量。

不同窗口中的线性系数ak和bk不同,因此对所有窗口的输出值相加求均值,最终得到的如式(19)所示:

以上为导向滤波的实现,快速导向滤波器对其进行了优化,将引导图像和输入图像进行下采样计算线性系数ak和bk,然后对ak和bk进行上采样并恢复原始尺寸,该方式在保证精度的前提下,减少了时间复杂度,缩短了运算量。

经过快速导向滤波处理的图像被去除了纹理和噪声的干扰,因此算法的纹理免疫性得到提高。之后通过Canny 算子对经过滤波处理的图像进行边缘检测和移除图像中的边缘,以减小干扰[20]。最后,对处理后的图像进行交叉差分,以凸显块效应,交叉差分具体介绍如第2.2 节所示。

2.2 差分滤波器的选择

对图像进行差分可以在一定程度上减少图像内容的干扰,使结果更加准确。通过文献[21]可知,选择合适的差分方式更能够使结果事半功倍。对于差分方式的选择依据如下所示:设I是大小为M×N的输入图像,I(x,y)是像素点(x,y)的强度值,并且其取值范围为0 ≤x≤M-1 和0 ≤y≤N-1。

文献[22]通过计算图像梯度大小的绝对值来检测块效应,使用的水平方向和垂直方向的差分滤波器定义分别如式(20)和式(21)所示:

上述一阶差分对网格弱水平边缘的刻画能力尚有不足,为了进一步改善性能,文献[23]定义了二阶差分滤波器的水平和垂直方向分别如式(22)和式(23)所示:

一阶差分滤波器和二阶差分滤波器的效果如图4所示,其结果受到图像中边缘和纹理的影响较大。

图4 QF=50 的JPEG 图 像Fig.4 JPEG images with QF=50

为了减少这些干扰,本文引用文献[24]中提出的交叉差分滤波器,其表达式如式(24)所示:

如图5 所示,由于网格提取方法具有局限性,压缩质量越高,JPEG 网格越不明显,网格检测难度越高。

图5 不同质量因子下的交叉差分图像对比Fig.5 Comparison of crossover images at different quality factors

通过以上步骤,首先得到纹理噪声和边缘移除的图像,之后对其进行交叉差分以凸显块效应,得到差分图像I′(x,y)。对差分图像的极值区间间隔直方图进行估计,并结合似然估计和光谱分析,求出降尺度因子的估计值。直方图的计算和降尺度因子的估计步骤如下:

1)计算差分图像I′(x,y)的极值直方图。在不失一般性的情况下,本文以来表示x方向的差分,其极值点如式(25)所示:

之后,计算极值点的相邻区间直方图Nf(i),i∈N。

2)估计峰值周期。峰值的周期性间隔T为移位的块效应网格的周期即8λ,故重采样因子的估计为:

由于相邻极值之间的间隔必须为整数,因此仍然采用文献[14]中的方式,将光谱法和最大似然估计相结合来估计降尺度因子的最终值。

3 实验结果与分析

为定量评估算法性能,本文从Dresden图像数据库[25]中获取200 张未经压缩的图像,并使用最近邻核函数,将每张图像下采样2 倍[26-27],以避免相机内部可能产生的CFA 插值的干扰。验证本文方法的检测性能,首先用给定的质量因子{50,55,…,90}对选取出的未压缩图像进行压缩,之后从图像中截取128×128 的中心区域,再用给定的降尺度因子进行下采样操作,生成待测图像进行算法评估。为了更清晰地呈现算法的性能,本文采用文献[28]的算法评价标准即绝对误差(Mean Absolute Error,MAE)进行评估。

图6 展示了在不同插值核下,针对不同质量因子的JPEG 图像进行降尺度因子估计的绝对误差。由图6 可知,文献[13]的光谱分析法对于篡改图像降尺度因子的检测准确性更低,原因是下采样光谱峰较为微弱难以被提取,且JPEG 压缩导致的峰值会产生干扰。文献[14]算法的性能随着压缩质量因子的提升而下降,这是因为当质量因子较大时,JPEG压缩产生的块效应网格更微弱,容易受到图像纹理和边缘产生的伪周期的干扰。对此,本文算法采用快速导向滤波去除了图像纹理和噪声的干扰,并引入交叉差分凸显了块效应,使极值区间间隔直方图的提取准确率更高。通过实验结果的对比分析,验证了本文算法能有效减轻图像纹理对重采样估计的影响,具有较强的纹理免疫能力。

图6 不同质量因子下针对3 种插值核函数的降尺度因子估计性能Fig.6 Downscaling factor estimation performance for three kinds of interpolation kernel functions under different quality factors

为更直观地展示算法性能,对比了在3 种不同插值核函数下压缩质量因子不同的JPEG 图像检测性能,结果如表1~表3 所示,表中加粗数字表示该组数据最小检测误差。

表1 bicubic 插值核函数下不同压缩质量因子的JPEG 图像检测性能Table 1 JPEG image detection performance with different compression quality factors under bicubic interpolation kernel function

表2 bilinear 插值核函数下不同压缩质量因子的JPEG 图像检测性能Table 2 JPEG image detection performance with different compression quality factors under bilinear interpolation kernel function

表3 lanczos2 插值核函数下不同压缩质量因子的JPEG 图像检测性能Table 3 JPEG image detection performance with different compression quality factors under lanczos2 interpolation kernel function

通过对表1~表3 进行分析可知:

1)对于不同压缩质量因子下的JPEG 图像,以不同的插值核进行下采样操作,文献[13]基于光谱分析法的检测误差均比较大。主要原因为下采样操作在频谱图上引起的峰值较微弱,且JPEG 压缩会在频域内产生额外的干扰峰值(JPEG 压缩峰和由于离散傅里叶变换的对称性导致的峰值)。而光谱分析法依赖于重采样峰的提取,因此更容易受降尺度因子的影响

3)文献[14]的检测结果随着压缩质量因子的上升而下降,这是因为质量因子越高,JPEG 压缩越不明显,块效应更加微弱,直方图的检测更加困难。同时,图像纹理的分布属性具有重复性和规律性,即局部统计特征呈现周期性变化,该变化会干扰直方图的提取,影响其统计特性的捕捉,进而干扰结果的准确性。本文算法利用快速导向滤波削弱图像纹理,增加了模型的纹理免疫性。另外,对经过快速导向滤波处理后的图像使用交叉差分滤波处理,能够凸显块效应,提高算法的检测性能。该算法针对JPEG压缩的图像具有更好的鲁棒性,估计结果的准确率更高。

4 结束语

针对直方图的提取容易受到图像纹理噪声、边缘等影响的问题,本文提出一种用于JPEG 预压缩图像降尺度因子估计的纹理免疫块效应分析算法。利用快速导向滤波器对图像进行预处理,去除图像纹理和噪声的影响,并使用Canny 算子对处理后的图像进行边缘检测与去除,减少图像边缘导致的伪周期干扰,从而更精确地提取直方图。此外,针对块效应强度随压缩质量因子的提高而减弱的问题,本文引入交叉差分凸显块效应网格,以增加算法的鲁棒性。下一步将研究JPEG 图像旋转角度、复合重采样(如旋转后缩放、缩放后旋转)等对提取直方图的影响,以更准确地判断图像的真实性。

猜你喜欢
插值直方图差分
RLW-KdV方程的紧致有限差分格式
符合差分隐私的流数据统计直方图发布
滑动式Lagrange与Chebyshev插值方法对BDS精密星历内插及其精度分析
数列与差分
基于FPGA的直方图均衡图像增强算法设计及实现
用直方图控制画面影调
基于pade逼近的重心有理混合插值新方法
混合重叠网格插值方法的改进及应用
中考频数分布直方图题型展示
基于混合并行的Kriging插值算法研究