一种基于2-D Markov链模型的图像信息隐藏检测方法*

2011-07-24 12:03谭海曙赵慧民郭一缜丁晓艳
关键词:门限像素错误

谭海曙,赵慧民,朱 立,郭一缜,丁晓艳

(1.佛山科学技术学院电子信息工程系,广东 佛山 528000;2.广东技术师范学院电子与信息学院,广东 广州 510665;3.西安邮电学院通信与信息工程学院,陕西 西安 710121)

图像数据隐藏技术是数字多媒体加密、数字内容版权保护和数字信息传输管理的最新研究与实现方法,是多媒体信息安全技术的关键研究领域[1]。自从1999年Shannon提出信息隐藏的数字水印类似于通信后,信息隐藏专家Cox J[2]等提出并发展了“水印作为边信息通信(WatermarkingascommunicationwithSideInformation)”的理论,进一步把信息隐藏技术和通信理论联系起来。但是,目前研究的技术理论都是把载体图像数据作为独立等均匀分布(I.I.D分布),忽视了实际自然图像载体分布的非高斯性对水印安全性的影响[3-4]。而在文献[5]中,Sullivan K等提出一种基于Markov模型的数据隐藏方法,并形成了一种检测图像的经验变换矩阵。由于此矩阵元素非常大(如8-bit灰度级图像有65 536个元素),且忽略了一些有用信息,所以,它不能直接作为数据隐藏的特征矢量[6-7]。因此,其应用有限。受其启发,通过设置图像的预测错误门限,本文提出一种基于Markov链模型的数据隐藏检测研究方法。其中,图像的每个像素通过相邻像素预测,预测错误通过此像素减去预测像素值进行设置。由于自然图像相邻像素之间具有高度相关性,此预测错误值大都集中在0附近小范围内。同时,考虑到图像预测错误的较大值主要由图像本身引起,因此,我们对预测错误设置一定的门限以限制图像预测错误的动态范围。这样,图像的预测错误可通过Markov链模型化处理。另外,为了降低变换矩阵的维数,本文分别使用线性和非线性SVM内核函数作为分类器对矩阵的特征矢量进行分类。

1 预测错误的设定和Markov链模型

1.1 图像预测错误的设定

自然图像一般是连续的、光滑的,像素之间高度相关性。而隐藏的数据对载体图像是独立的,所以,水印处理改变了图像的连续性。结果是,降低了像素之间、位平面和图像块的相关特征。因此,2-D分解后,这里使用相邻像素预测当前像素。预测在三个方向完成,即,水平方向、垂直和对角方向。由此获得的预测错误如下:

对于图像的每个像素,我们得到三个预测错误。其中,eh(i,j)表示图像像素(i,j)在水平方向的预测错误;ev(i,j)和ed(i,j)分别代表了垂直和对角方向的预测错误。由此,形成了对应的三个图像预测错误:Eh,Ev,Ed。

1.2 图像预测错误的门限设置及其Markov链模型

与一个图像中不同像素间的差分失真相比,数据隐藏引起的失真通常较小。因此,根据检测理论,定义图像检测门限T和预测错误的关系如下:

(2)

即大于检测门限时,图像预测错误作为0。也就是说,从数据隐藏角度来看,图像的像素被认为是光滑的。因此,图像预测错误的范围限制在[-T,T]之间,仅有2T+1个可能的值。取代文献[5]的1-D马尔科夫链形式,图1说明了一种应用于预设图像门限错误的2-D马尔科夫链模型。其中,图像块大小为8*8,箭头表示了马尔科夫链的状态转移,一个圆点代表一个像素。图1(a)为水平方向图像预测错误Eh的变换模型;(b)和(c)分别是垂直和对角方向图像预测错误Ev,Ed的模型。Eh,Ev,Ed变换矩阵的元素皆作为数据隐藏的特征矢量值。

图1 图像预测错误的Markov链模型

2 基于Markov链的检测理论

基于1.2分析的图像预测错误变换模型,为了确定图像像素间的依赖性,我们把图像数据的Markov链模型作为信息隐藏的特征数据模型进行研究。该模型是像素值变化序号n的行、列和对角扫描索引形成的随机序列,服从条件概率分布:P(Yn|Yn-1,Yn-2,.....,Y1)=P(Yn|Yn-1)。在这种模型下,当前像素的变换概率直接取决于相邻的像素条件。因此,{Yn,n=1,2,…,l}形成一了种Markov链。对于自然图像像素位置(i,j),Markov链的变换矩阵定义为

(3)

其特征矢量形式为Y=(y1,y2,...,yl)t。如果定义i到j预测错误e(i,j)=ηi,j(y),那么,Markov链变换矩阵的一种实现是:

(4)

这样,Markov链变换矩阵就对2-D随机图像信源的概率密度函数实现了一种检测估计。

3 SVM训练与特征分类

SVM是一种有效的图像分类工具,它不仅能处理Markov线性模型状态数据,也能够处理Markov非线性模型状态数据。对于线性可分离情况,SVM分类器可以把其作为正负分离的一种超平面模式。如果分离变量yi,i=1,2,...,l,代表载体图像的特征矢量;ωi=±1表示数字水印的数据形态。那么,SVM训练数据满足下列条件:

(5)

其中,Wt为包含数字水印的混合数据随机向量。则,我们可以建立一种拉格朗日公式为:

(6)

αi表示由于训练数据(3)、(4)的不等式条件引入的拉格朗日乘法因子,在数字水印系统中表示嵌入水印的强度。对应W和b,训练梯度L给定的条件是:

(7)

(8)

SVM分类器对特征数据进行训练后,利用W和b就可以进一步分类来自检测图像得到新的数据样本Z。如果(Wt·Z+b)大于或等于0,那么,此图像存在隐藏的信息。反之,则不包含隐藏的数据。

对于非线性分离的情况,通过使用多项式内核函数,训练学习过程能够把输入的特征矢量映射到更高维数超平面线性空间进行处理。

4 实验与结果分析

为了验证提出方法的可行性,从Internet下载了2 812幅图像并从CorelDRAW软件系统取出了1 096个样本图像进行实验。所有的彩色图像通过下式转换为灰度图像:

Y= 0.299R+ 0.587G+ 0.114B

(9)

实验步骤说明如下:

1)对每幅测试图像进行t(t=1,2,3)级小波分解;

2)在t尺度下,对各个频率通道的小波系数进行提取;

3)通过提取的小波系数,构造该尺度下水平、垂直和对角方向上的观察值序列,由图1模型计算Eh,Ev,Ed;

5)由T确定训练数据对(yi,ωi),i=1,...,l。

6)通过式(5)-(8)执行训练,确定w,b;并由此分类样本数据,每类数据进行20次测试,检测隐藏的信息。

4.1 线性内核函数实验

实验分别应用了正交扩频SS、量化索引调制QIM和LSB数据隐藏方法[8-10]。其中,SS方法中α=0.1;QIM的量化步长为5,嵌入率等于0.5 bpp。对于以上的数据隐藏方法,不同的图像嵌入不同的随机信号,其嵌入率范围为0.3 bpp-0.01 bpp[11]。实验时,根据预测错误界定范围,取门限初始值为T=max(LHi,j+HLi,j+HHi,j)/9,多次实验后T=4;预测错误值范围为[-4,4]。因此,变换矩阵的维数是9*9,即每个方向图像的预测错误有81个特征值。由于有3个方向的预测,每个图像特征总数是243。

随机选择一半原始图像及其对应的混合图像,通过线性SVM快速训练,并与文献[5]在同样条件下进行对比,表1为基于Markov链模型应用各种嵌入方法实验检测的结果。

表1 各种数据隐藏方法的检测率实验结果

由表1可见,对于所有的数据隐藏嵌入实现方法,本系统实现的性能均优于文献[5]的性能。特别是,在各种嵌入率条件下,LSB方法的检测效果更具有代表性。

4.2 非线性内核函数实验

表2 各种数据隐藏方法的检测率实验结果

由实验结果可见,本系统的正确检测率比文献[5]提高了约11%。在嵌入率为0.1 bpp时,应用SS和QIM进行实验研究,正确检测率超过90%;而对于各种嵌入率的LSB方法,本系统正确检测率也优于文献[5]的检测方法。

5 结 论

基于预设图像错误门限的2-D马尔科夫链模型,并使用线性和非线性SVM作为特征数据的分类器,本文提出了一种有效的数据隐藏检测方法。在一定的嵌入率条件下,分别应用正交扩频SS、量化索引调制QIM以及LSB的嵌入算法进行实验,非线性SVM马尔科夫链检测方法优于线性SVM马尔科夫链检测方法。而在同样的条件下,本文检测数字水印的效果均优于文献 [5]的实现方法。未来,把本文检测数字水印的技术与数据隐藏水印信道技术的研究相结合,成为下一步的研究方向。

参考文献:

[1]JOSEPH J K, RUANAIDH O, THIERRY PUN.Rotation, scale and translation invariant spread spectrum digital image watermarking[ J ].Signal Processing, 1998, 66 (3): 303-317.

[2]COX J, MILLER L,MCKELLIPS L.Watermarking as communications with side information[J].Roceedings of the IEEE, 1999,87(7):1127-1140.

[3]MOULIN P.The role of information theory in watermarking and its application to image watermarking[J].Signal Processing, Special Issue on Information Theoretic issues in Digital Watermarking, 2001, 81(6):1121-1139.

[4]MOULIN P, LIU J.Analysis of multiresolution image denoising schemes using generalized-gaussian and complexity priors[J].IEEE Trans on Information Theory, 1999,45(3): 909-919.

[5]SULLIVAN K, MADHOW U, CHANDRASEKARAN S, and MANJUNATH B S.Steganalysis of spread spectrum data hiding exploiting cover memory[C]∥SPIE2005,2005,5681:38-46.

[6]WANG L Y,CUI L R,CHEN W, et al.Availability of Markov repairable systems with changeable operating regimes[C]∥IEEE the 17th International Conference on Industrial Engineering and Engineering Management, 2010:924-926.

[7]BATU T,GUHA S,KANNAN S.Inferring mixtures of Markov chains[R].In ACM Symposium on Theory of Computing, 2006: 247-257.

[8]赵慧民,范九伦.一种在JPEG2000中隐藏指纹图像的方法研究[J].电路与系统学报,2010,15(2):27-32.

[9]曹刚,游志胜,刘直芳.基于小波隐性马尔可夫模型的人脸检测[J].信号处理,2004,20(1):26-29.

[10]赵慧民,张惠乐,胡学骏.一种基于树结构的高斯分布扩频指纹嵌入技术的方法研究[J].中山大学学报:自然科学版,2006,45(1):42-45.

[11]DEKUN Z,YUN Q S,WEI S,et al.Steganalysis based on Markov model of thresholded prediction-error image[C]∥IEEE International Conference on Multimedia Engineering(ICME),2006:1365-1368.

猜你喜欢
门限像素错误
像素前线之“幻影”2000
在错误中成长
基于规则的HEV逻辑门限控制策略
随机失效门限下指数退化轨道模型的分析与应用
VoLTE感知智能优化
“像素”仙人掌
基于Neyman-Pearson准则的自适应门限干扰抑制算法*
ÉVOLUTIONDIGAE Style de vie tactile
高像素不是全部
不犯同样错误