一种挖掘低速率语音编码最低有效位的新方法

2016-09-08 10:40吴秋玲
计算机应用与软件 2016年8期
关键词:适应度比特遗传算法

吴秋玲 吴 蒙

1(南京理工大学紫金学院 江苏 南京 210046)2(南京邮电大学通信与信息工程学院 江苏 南京 210003)



一种挖掘低速率语音编码最低有效位的新方法

吴秋玲1,2吴蒙2

1(南京理工大学紫金学院江苏 南京 210046)2(南京邮电大学通信与信息工程学院江苏 南京 210003)

信息隐藏是保证信息传输安全的重要手段。针对VOIP系统中低速率语音编码在信息隐藏时最低有效位难以确定的问题,利用遗传算法GA(Genetic Algorithm)作为优化工具,以客观的语音质量评价标准和信息隐藏容量为依据构建遗传算法目标函数,提出一种能够挖掘低速率语音编码最低有效位的新方法。以G.729a语音编码为例进行实验测试,测试结果表明,该方法在给定的语音质量下,以隐藏容量最大为目标可以精确搜索到所有最低有效位。最后通过在语音帧的最低有效位上进行机密信息的隐秘传输验证信息隐藏技术的可行性。

信息隐藏最低有效位遗传算法低速率语音编码

0 引 言

信息隐藏技术是指将特定的信息嵌入到数字化的载体信息中,在隐藏信息内容的同时也隐蔽信息传播这一行为,以保证密文不引起监控者的注意从而减少被攻击的可能性[1]。信息隐藏技术集密码学、通信理论、编码理论、数字信号处理等多学科理论和技术于一身,是对重要的信息在网络上传输时实施安全保护的一种重要而有效的技术手段。随着Internet的快速发展,以VOIP为代表的流媒体业务已成为网络服务中炙手可热的热点业务。但是网络环境的复杂性、多变性以及信息系统的脆弱性,决定了网络安全威胁的客观存在。因此研究在VOIP系统中嵌入隐藏信息来保证机密信息的安全性成为信息隐藏领域的一大热点[2]。VOIP语音通信系统普遍采用的低速率语音编码格式有G.729a、G.723.1和iLBC等,在语音帧的最低有效位上进行信息隐藏是一种最常用最直接的信息隐藏方法,但是这些最低有效位往往难以确定。遗传算法GA是模拟自然界生物进化过程与机制来求解极值问题的一类自组织、自适应人工智能技术,是一种仿生随机优化算法,已被广泛地用于各种组合优化问题。本文采用遗传算法为优化工具,以客观的语音质量评价标准和隐藏容量为评价依据,研究如何挖掘以G.729a语音编码为代表的低速率语音编码中可隐藏机密信息的最低有效位。

1 相关研究工作

目前,应用于VOIP的低速率语音编解码器的信息隐藏研究内容还很少,传统的语音信息隐藏方法针对的是PCM(Pulse Code Modulation)编码[3]。这些隐藏方法都不适用于低速率语音,因为低速率语音已经经过压缩,去除了很多冗余信息,因而隐藏空间非常有限且难以提取[4]。文献[5]提出了一种基于码书位置向量的信息隐藏算法,取得了较好的隐藏效果;文献[6,7]提出了基于iLBC的自适应码本的信息隐藏方法;文献[8]针对G723.1语音编码方法提出一种矢量量化索引的隐藏算法。在语音帧的最低有效位研究方面,文献[9]采用分段信噪比评价语音质量,分析了G.729语音帧的最低有效位;文献[10]采用对语音帧逐位取反的方法确定G.729a的最低有效位。以上文献中的研究方法都是针对单一比特位进行测试的研究,在实际运用中,语音帧中可隐藏信息的位置往往有很多位。那么在多个比特位上隐藏信息后载体语音质量如何,在保证载体语音质量的情况下最大隐藏容量是多少,针对多种低速率语音编码方案有没有一种通用的确定语音帧最低有效位的方法,目前这方面的研究还甚少。

2 G.729语音帧和遗传算法简介

2.1G.729a语音编码方法简介

G.729a是ITU于1996年3月发布的,采用共轭结构—代数激励线性预测技术,其数据传输速率是8 kb/s。G.729a编解码器按8 kHz采样,16 bit量化,每帧长10 ms,语音帧被压缩为80 bit,每一位都代表相应的参数向量,若其值发生变化会对整个语音质量有不同程度的影响。

2.2遗传算法基本原理

GA是模拟自然界的遗传进化过程而发展起来的一类随机优化算法,它主要是由选择算子、交叉算子和变异算子组成。标准遗传算法的主要运算过程描述如下:

1) 编码。由于遗传算法不能直接处理解空间的数据,须通过编码将数据表示成遗传空间基因型串结构。

2) 种群初始化。随机生成由多个个体组成的群体作为初始群体。

3) 适应度函数。遗传算法在搜索进化过程中一般不需要其他外部信息,仅用评估函数值来评价个体或解的优劣,并作为以后遗传操作的依据。因此适应度函数的构建极为重要。

4) 终止条件判断。若满足终止条件,则以进化过程中所得到的具有最大适应度的个体作为最优解输出,终止计算;否则,转至下一步。

5) 选择算子。选择算子确定了算法的宏观进化方向,保证种群朝全局最优解的方向进化,但在微观上并不改变个体的基因组成,是遗传算法中极其重要的一个环节。

6) 交叉算子。交叉算子通过模拟自然界生物的杂交过程对个体进行杂交操作,不断产生新个体、增加种群的多样性、扩大寻优范围,从而使得GA具有较强的搜索能力。

7) 变异算子。变异算子通过模拟自然界生物的基因突变过程挖掘个体基因的多样性,克服局部收敛。

3 基于遗传算法的语音编码最低有效位挖掘方法

3.1编码方案

二进制编码是遗传算法中最常用的一种编码方法。G.729a中语音帧的每一比特位都有其特殊的意义,把对语音失真影响不大的比特位称为最低有效位,可用来装载机密信息。把语音帧的比特值取反后通过测试其对语音质量的影响大小来判断该比特位是否是最低有效位。G.729a语音帧上比特位的值都是0或1的二进制数,则可以把该语音帧按“位”的顺序组成长度为80的二进制串,记为A(n),n=80。把该语音帧的某些比特位取反后得B(n),则C(n)=A(n)⊕B(n)。二进制串C(n)用来标记语音帧A(n)中被取反的比特位。若C(n)中某一位的数值为1 ,则表示语音帧的相应位置上该比特位值被取反;反之,则表示语音帧的该比特位值没有被取反。根据C(n)中“1”的个数和分布情况可精确获得该语音帧的最低有效位,因此可把二进制串C(n)作为个体参与进化。

3.2构建适应度函数

遗传算法采用适应度函数来度量群体中各个个体在进化计算中有可能达到或接近于找到最优解的优良程度。适应度较高的个体遗传到下一代的概率较大;而适应度较低的个体遗传到下一代的概率相对较小。度量个体适应度的函数称为适应度函数。

PESQ(Perceptual evaluation of speech quality)是 ITU-T P.862建议书提供的客观音质评价方法。通过比较原始语音信号和携带机密信息的语音信号输出一个语音质量失真的预测值,其范围在1.0至4.5之间。PESQ值越大语音质量越好,VOIP语音通信质量一般要求PESQ大于3.5。

(1)

即在满足语音质量PESQ大于给定值M的情况下,求信息隐藏容量的最大值问题。

适应度函数的具体计算步骤为:

(1) 假设种群是N×80的矩阵,每个行向量构成一个个体Ci(n)( i=1,2,…,N),共有N个个体。把A(n)和Ci(n)代入关系式C(n)=A(n)⊕B(n)得到比特位被取反的语音帧Bi(n),i=1,2,…,N。

(2) 对比按降值语音帧Bi(n)进行G.729a编解码输出的语音信号和按原始语音帧A(n)进行G.729a编解码输出的语音信号的质量,求得PESQ的值。

(3) 若PESQ大于给定值M,按式(1)计算个体Ci(n)的适应度函数值,否则淘汰该个体。

3.3算法步骤

将采集的语音信号经过预处理和G.729a编码后产生数据帧A(n),按如下步骤挖掘G.729a的最低有效位:

步骤1初始化:设置交叉概率pc、变异概率pm、种群数量和最大进化代数gen等控制参数,并产生N×80的矩阵作为初始种群P(0)。

步骤2计算种群的适应度:按3.2节中的步骤计算种群中所有个体Ci(n)的适应度函数。根据嵌入信息确定种群中所有个体的适应度函数值,对于被淘汰的个体用适应度值最大的个体替换。

步骤3输出适应度值最大的最佳个体。

(1)侧向边界排泄量。根据达西定律,计算出识别期(东北部流水边界)地下水径流排泄量为4.071 8×104 m3/d;验证期为4.344 1×104 m3/d。

步骤4选择操作:使用轮盘赌法得到过渡种群P1(0)。

步骤5交叉操作:按交叉概率pc,对P1(0)中每一对个体执行交叉操作,得到过渡种群P2(0)。

步骤6变异操作:按变异概率pm,对P2(0)中每一个个体执行变异操作,得到下一代种群P(1)。

步骤7在P(1)中保留上一代的最佳个体。

步骤8检验新一代种群P(1)是否满足结束条件,若满足则结束程序;否则按步骤2-步骤7继续进化,直到寻找到全局最佳个体Cmax(n)。

步骤9按全局最佳个体Cmax(n)中“1”的位置确定G.729a语音帧中的最低有效位。

3.4算法性能分析

算法采用遗传算法作为优化工具,在满足语音质量的条件下,以隐藏容量最大构建适应度函数。利用遗传算法的并行计算特点,能够准确搜索出G.729a语音帧中的所有最低有效位。由于遗传算法采用种群为对象进行多代进化搜索,从计算语音PESQ的次数上来看,假设种群中有N个个体,在第G代搜索到最优个体,则计算PESQ的次数为N×G。可见,算法在尽量挖掘G.729a最低有效位的同时,算法复杂性较高。

文献[9,10]采用单个比特位取反的方法测量该比特位对语音质量的影响程度,然后选取对语音质量影响较小的一些比特位作为最低有效位。该方法计算PESQ的次数为80次,计算量较小,但是对最低有效位的挖掘不够完全,对语音质量也没有定量要求。

采用遗传算法挖掘最低有效位的方法计算量与文献[9,10]相比要大,但是由于挖掘语音压缩算法的最低有效位无需满足实时性要求。因此不太考虑挖掘时间多少,而更关注所挖掘的最低有效位位数多少以及准确性。此外,算法在构建适应度函数后无需人为操作可自行搜索最优解,也不受语音编码方法的影响,通用于G.711、G.723、G.728、G.729、iLBC等多种编码方法。

4 实验测试与结果分析

为了测试算法的有效性,进行两类测试实验。第一类实验是选取ITU P.501附录B提供的音频库中的语音作为载体语音样本进行测试,挖掘出G.729a在不同载体语音PESQ值条件下的最低有效位;第二类实验是用挖掘到的最低有效位装载机密信息进行信息隐秘传输实验,测试用最低有效位进行隐秘传输的可行性。

4.1最低有效位挖掘测试

遗传算法参数为:初始种群大小为50×80,交叉概率pc=0.8,变异概率pm=0.1,最大运行代数gen=100。选取标准样本库中的中文男声、中文女声、英文男声和英文女声共4种计40条样本语音逐条进行测试。首先进行8 kHz的采样和16 bit的量化得到PCM格式的语音,经过G.729a编码后,产生数据帧A(n)。按3.3节的算法步骤,可进化出在满足给定PESQ值的条件下,信息隐藏容量最大的最佳个体Cmax(n),从而定位G.729a语音帧中的可隐藏信息的比特位。

经过测试,在PESQ>3.5时,平均在28代时出现最佳个体Cmax(n),有部分语音产生的最佳个体与Cmax(n)稍有不同,相差1~2个比特位。表1给出的是PESQ>3.5时根据最佳个体Cmax(n)确定的最低有效位的语音帧结构。此时隐藏容量为R(x)=15.0%,表中阴影部分为最低有效位,有下划线的第50位和第79位是与Cmax(n)产生的偏差位。在PESQ>3.8时,平均在25代时出现最佳个体Cmax(n),有部分语音产生的最佳个体与Cmax(n)相差1个比特位。表2给出的是PESQ>3.8时根据最佳个体Cmax(n)确定的已标注最低有效位的语音帧结构。此时隐藏容量为R(x)=8.75%,第56位是偏差位。比较表1和表2的数据可知,PESQ的值越高,语音质量要求越高,则可用于信息隐藏的比特位越少,隐藏容量越小。

表1 PESQ>3.5语音帧可隐藏信息比特位一览表

表2 PESQ>3.8语音帧可隐藏信息比特位一览表

4.2最低有效位信息隐藏测试

用二进制机密信息替换G.729a语音帧中的最低有效位,测试信息隐藏的可行性。录制语音“请注意信息安全”作为载体语音,时长1781 ms,共179帧。机密信息是一段关于信息安全的文字简介,共50个字符,800 bit。在不同载体语音质量要求下,携密语音波形对比图如图1所示。

图1 载体语音载密前后时域波形图

4.3实验结果对比分析

1) 根据表1和表2的实验结果,在PESQ>3.5时挖掘出12位最低有效位,隐藏容量为R(x)=15.0%;在PESQ>3.8时挖掘出7位最低有效位,隐藏容量为R(x)=8.75%。文献[9]挖掘的G.729a语音帧最低有效位是第16、17、18位,信息隐藏容量为2.62%。文献[10]选用8个对语音质量影响最小的比特位作为G.729a的最低有效位,隐藏容量为10%。显然文献[9,10]对G.729a的数据帧中最低有效位没有挖掘完全。因此算法在较文献[9,10]具有优势。

2) 由图1中载体语音载密前后时域波形对比图可知,与原始语音波形(a)相比,(b)和(c)都带噪声,但是由于人耳对语音质量的微小下降不敏感,感觉不到机密信息的存在。(c)比(b)的噪声小,说明最低有效位个数越少,语音质量越高,但由于语音信号载密后PESQ>3.5,因此在G.729a的最低有效位上隐藏机密信息是可行的。

3) 算法同样适用于挖掘其他语音编码格式的最低有效位。

5 结 语

由于低速率语音编码已经去除了语音的绝大多数冗余信息,因此在其语音帧中挖掘用于隐藏机密信息的最低有效位是一项非常具有挑战性的工作。利用遗传算法作为优化工具,以语音帧的比特位是否取反形成的二进制串作为个体进行二进制编码,以客观的语音质量评价标准和隐藏容量构建适应度函数进行算法测试。实验测试结果表明,该方法在保证给定语音质量的前提下能够确定语音帧中的所有最低有效位,并计算隐藏容量。由于本方法不涉及G.729a的具体编解码方法,因此对于其他编码格式的语音帧中最低有效位的确定也是适用的。

[1] 顾桃峰,岳海燕.基于DCT系数的加密信息隐藏技术的研究与实现[J].计算机应用与软件,2011,28(6):173-175.

[2] Mazurczyk W.VOIP steganography and its detection:A survey[J].ACM Computing Surveys,2013,2(46):20.

[3] Miao Rui,Huang Yongfeng.An approach of covert communication based on the adaptive steganography scheme on voice over IP[C]//IEEE International Conference on Communications,2011:1-5.

[4] Xu Erchi,Liu Bo,Xu Liyang.Adaptive VOIP stegangraphy for information hiding within network audio streams[C]//Proceedings of the 14th International Conference on Network-Based information Systems.Tirana:IEEE Press,2011:612-617.

[5] Yang Jun,Bai Sen,Huang Yongfeng,et al.Implementation of steganography based on HOOK[C]//Proceedings of the 2011 International Conference on Informatics,Cybernetics,and Computer Engineering,Melbourn,Australia,2011:133-141.

[6] 杨婉霞,余晖,胡萍.在压缩语音编码中集成信息隐藏方法研究[J].电子学报,2014,42(7):1305-1309.

[7] 杨婉霞,孙东红,黄永峰.基于语音编码中自适应码本的隐藏信息方法[J].计算机工程与设计,2013,34(8):2656-2661.

[8] Li songbin,Taohuaizhou,Huang yongfeng.Detection of quantization index modulation steganography in G.723.1 bit stream based on quantization index sequence analysis[J].Journal of Zhejiang University SCIENCE C,2012,13(8):624-634.

[9] Liu Lihua,Li Mingyu,Li Qiong,et al.Perceptually transparent information hiding in G.729 bit stream[C]//proceedings of the 4th international conference on intelligent information Hiding and Multimedia Signal Proceeding.Harbin:IEEE.Press.2008:406-409.

[10] 郭舒婷,田晖.一种基于G.729a语音的信息隐藏方法[J].华侨大学学报:自然科学版,2014,35(3):277-282.

A NEW METHOD OF MINING LEAST SIGNIFICANT BIT IN LOW BIT-RATE SPEECH CODE

Wu Qiuling1,2Wu Meng2

1(CollegeofZijin,NanjingUniversityofScienceandTechnology,Nanjing210046,Jiangsu,China)2(CollegeofTelecommunicationsandInformationEngineering,NanjingUniversityofPostsandTelecommunications,Nanjing210003,Jiangsu,China)

Information hiding is an important means to ensure the security of information transmission. In view of the difficulty of locating the least significant bit of low-rate speech code in VOIP system when hiding information, we use genetic algorithm as the optimisation tool and construct the objective function of genetic algorithm according to the objective evaluation criterion of speech quality and the capacity of information hiding, as well as propose a new method which can mine the least significant bit of low-rate speech code. Experimental tests have been carried out on the example of G.729a speech code, test results show that the method can accurately determine all the least significant bits with the object of maximising the information hiding capacity under the given voice quality. Finally the feasibility of information hiding technique is verified by the covert transmission of confidential information in least significant bit of speech frame.

Information hidingLeast significant bitGenetic algorithmLow bit-rate speech code

2015-02-04。江苏省普通高校研究生科研创新计划项目(KYLX_0815);江苏省高校自然科学研究重点项目(10KJA510035)。吴秋玲,讲师,主研领域:信息安全,信号处理。吴蒙,教授。

TP391.4

A

10.3969/j.issn.1000-386x.2016.08.061

猜你喜欢
适应度比特遗传算法
改进的自适应复制、交叉和突变遗传算法
一种基于改进适应度的多机器人协作策略
比特币还能投资吗
比特币分裂
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
基于遗传算法和LS-SVM的财务危机预测
比特币一年涨135%重回5530元
基于空调导风板成型工艺的Kriging模型适应度研究
软件发布规划的遗传算法实现与解释
基于改进的遗传算法的模糊聚类算法