窃听信道下基于双分簇技术的信源安全有损传输

2022-11-09 07:14胡沐宇

电子学报 2022年9期

徐明，胡沐宇

（上海海事大学信息工程学院，上海 201306）

1 引言

随着网络信息技术的发展，各个领域产生的信息量呈现出爆炸性增长，其中敏感和隐私信息如生物识别中的特征数据、植入式医疗电子设备中的无线可靠传输、视频流媒体传输以及电子商务交易数据集之类的传输处理方式就显得尤为重要［1～4］．未经处理的原始信息量巨大，为了有效传输，需要进行压缩即编码．在该背景下，信息的压缩和安全传输技术面临挑战．信息论通过研究网络传输中信息流的极限以及达到这些极限的最优编码方案来提高系统的安全性．

基于信息论实现信源的安全传输最早由Shannon提出［5］．在此基础上，Wyner提出假设窃听信道与合法信道相比是退化的，那么消息在有噪信道中可以安全传输［6］．Csiszár和Körner将此结论拓展到一般的广播信道，并根据窃听者对传输信息的不确定程度来衡量信道的保密级别，建立存在公共消息和保密消息的速率-泄露率区域（rate-leakage region）［7］．上述工作都基于信源的安全无损传输，即合法接收者在信源压缩传输时不产生失真的情况下重建信源．如果信源在压缩传输时产生失真，那么就要考虑失真对信源安全传输的影响．Wyner和Ziv定义了信源安全有损传输下的速率-失真函数（rate-distortion function），并在传输的约束条件中增加了速率、失真和泄露率等有限码率约束，目的是让窃听者对传输的消息尽可能保持未知［8］．Chia和Chong刻画了具有边信息的Wyner-Ziv信源编码的速率-失真区域，指出解码器到编码器的反馈不会减少总速率［9］．Villard和Piantanida构建了边信息对窃听者非因果性可知的信道模型，考虑了未编码边信息对合法用户非因果性可知时，合法用户接收到的信源能无损重建的情况，得出更紧的速率-失真-模糊率区域［10］．考虑到无线衰落信道的统计特性不断变化，Koyluoglu等人引入状态信息，对具有状态的广播信道建立索引，得出退化高斯信道模型的最优角点以及上界与可达区域的距离［11］．Han等人提出状态信息对编码器非因果性可知的窃听信道模型，并得出该信道模型的保密容量下界以及密钥容量［12］．

通过上述分析可知，边信息有助于解码器减小信源与信源估计之间的失真，状态信息可以用来表征统计特征不确定的无线衰落信道以及提高消息传输速率．然而，由于无线信道的复杂性，特别是在无线衰落窃听信道下，往往既包含边信息又包含状态信息，并且窃听者可能窃听到边信息．如何设计安全可靠的编解码机制并对相关有限码率约束进行定界需要进一步研究．本文提出一种边信息对解码器非因果性可知和状态信息对编码器非因果性可知的安全有损传输方案，基于双分簇技术设计出信源编解码机制，并以该模型下的高斯噪声窃听信道为例进行具体分析，推导出速率-失真-信息泄露率的下界，然后引入模糊率，将信息泄漏率转化为估计信源的最小均方误差，得出信源估计最小均方误差的上界．考虑噪声功率不同的情况下的速率和失真的下界以及信源估计最小均方误差的上界进行仿真，得到三者之间最优权衡并对实验结果进行比较分析．

2 预备知识

2.1 基本符号

熵H(·)表示随机变量不确定性的度量；互信息I(·)表示一个随机变量中包含的关于另一个随机变量的信息量；X、Y、Z表示有限集合X、Y、Z上的离散型随机变量，x、y、z表示X、Y、Z的取值，概率分布分别为P(x)、P(y)和P(z)；xnk表示由(xi)i∈N*构成的序列(xk，xk+1，…，xn)，其中N*表示正自然数集，xn1简化为xn；若P和Q是联合高斯随机变量，ΓPQ表示P和Q的协方差矩阵；R表示实数集，Rd表示d维欧几里得空间．

2.2 相关定义

定义2若随机变量X在集合X上均匀分布，则保密编码(2nR，n)对应的信息泄露率Ie为

定义3如果一个以速率R，失真D，信息泄露率Ie构成的三元组(R，D，Ie)存在并进行信息的安全有损传输，对于任意δ＞0和n≥1，一个(n，R+δ)码序列满足以下2个条件，则(R，D，Ie)∈R3+是可达的．

3 系统模型与编解码机制

3.1 系统模型

本文所构建的具有边信息和状态信息的窃听信道模型由合法发送者Alice，合法接收者Bob以及窃听者Eve组成．Alice想发送信源信息给Bob，Bob根据接收到的消息重构信源，并确保泄露给Eve的信息尽可能少．编码器和解码器由编码函数f(n)：X n×Sn→Fn和解码函数g(n)：Yn×Bn→X n构成．编码器产生的序列Fn通过信道传输给Bob，Eve通过窃听信道进行窃听，状态信息Sn对编码器非因果性可知，并且与信道噪声相互独立．假设存在平均传输功率约束

则Bob可以通过接收到的序列Yn和边信息Bn重构信源，而Eve根据窃听到的序列Zn和边信息En不能重构信源．

3.2 编解码机制

根据上节提出的系统模型，设计了信源安全有损传输方案．该方案中的编码机制通过双分簇技术构造二维码本，目标是在有限码率约束下，使压缩失真和信息泄漏率尽可能小．

3.2.1 码本生成

（1）固定概率PF|XPV|XFPU|V使其达到信道容量，随机生成2nI(X；F)个序列f n(wf)，wf∈{1，…，2nF}．对于每个wf，独立并随机生成2nI(U；X|F)个独立同分布的码字序列un(wf，wu)，wu∈{1，…，2nI(U；X|F)}，并将un(wf，wu)随机分到大小相同的2nRX个簇C1(ru)中，簇的索引ru∈{1，2，…，2nRX}，该层分簇构成了码本的第1维.

（2）对于每个(wf，wu)索引对，随机生成2nI(V；X|U，F)个独立同分布的码字序列νn(wf，wu，wν)，wν∈{1，…，2nI(V；X|U，F)}，然后将码字序列νn(wf，wu，wν)随机分配到2nRC个大小相同的簇C2(rν)中，簇的索引rν∈{1，2，…，2nRC}，该层分簇构成了码本的第2维．

3.2.2 编码

（1）查找一个与信源序列xn联合典型的序列f n(wf)．根据覆盖引理［13］，存在这样的f n(wf)，随机选择一个与(xn，f n)高概率同分布的序列索引wf，将其发送给解码器.

（2）查找一个与(xn，f n)联合典型的序列un(wf，wu)．根据覆盖引理，随机选择一个相应簇的索引wu，将其发送给解码器.

（3）查找一个与(xn，f n，un)联合典型的序列νn(wf，wu，wν)．根据覆盖引理，随机选择一个相应簇的索引wν，将其发送给解码器．

3.2.3 传输

Alice发送索引wf，wu，wν，Bob得到其中是wf，wu，wν经过合法信道传输后得到的索引估计值；Eve得到其中是wf，wu，wν经过窃听信道传输后得到的索引估计值．

3.2.4 解码

Bob以速率R和失真D接收到Yn并获得关于信源的边信息Bn，通过解码器在簇C1(ru)中查找与(bn，f n)联合典型的序列un，在簇C2(rν)中查找与(bn，f n，un)联合典型的序列νn，由此得到状态序列sn，继续解码可得估计信源x̂n．

3.2.5 错误概率分析

将编码和解码过程中出现错误的事件记为ξ，考虑存在以下情形：

（1）典型性错误

将边信息的典型性错误记为事件ξ1，根据典型序列性质，存在ε→0使得不等式P(ξ1)=P{(X n，Fn，Bn，En)∉Tεn(X，F，B，E)}≤ε成立．将信道的典型性错误记为事件ξ2，其错误概率P(ξ2)=P{(Fn，Yn，Zn)∉Tε

n(F，Y，Z)}≤ε．

（2）编解码错误

将编解码错误记为事件ξ3，存在错误概率上界使得P(ξ3)≤ε．因此

4 速率-失真率-信息泄露率

本节利用信息论推导速率-失真-信息泄露率的下界并给出可达性证明和逆命题证明．

定理1若三元组速率-失真-信息泄露率(R，D，Ie)∈R3+，U，V分别属于有限集合U，V中的辅助随机变量，并存在马尔科夫链U-V-(X，F)-(B，E)和U-V-(F，S)-表示解码信源序列函数，则需要满足

证明

（1）可达性证明

①速率

定义信源的传输速率为R+δ（δ→0），δ表示传输中的误差值，则

②失真

将ϑ记为在编码步骤或者解码步骤出现错误的事件，令ε→0，则

③信息泄露率

式中（a）是因为在所有序列都高概率联合典型的条件下，根据信源的无记忆特性得到和H(En|Fn，Un，Cn)［14］．

（2）逆命题证明

①速率

式中（a）是根据随机变量F和B在时间上的独立性得到．

②失真

③信息泄露率

式中（a）是根据Fano不等式和马尔科夫链(Fn，Sn，X ni，得到.式中（b）根据解码器的解码机制，利用Csiszár求和式得到，因此n(Ri+δ)≥

证毕．

5 高斯噪声窃听信道的安全有损传输

在本节中，我们以具有边信息和状态信息的高斯窃听信道为例分析本文所提出的安全有损传输方案，推导出高斯噪声窃听信道中有限码率约束的界并给出证明，然后考虑不同传输条件下的情况并利用具体数据进行实验和分析．

5.1 高斯噪声窃听信道模型

图1描绘了高斯噪声窃听信道下具有边信息和状态信息的安全有损传输模型．其中Bob和Eve观测到的边信息噪声分别服从Nb～N(0，Pb)和Ne～N(0，Pe)分布．信道状态服从S～N(0，Ps)分布，合法信道噪声服从N1～N(0，Py)分布，窃听信道噪声服从N2～N(0，Pz)分布．合法信道的信道增益为g1，窃听信道的信道增益为g2，信道平均输入功率约束为P．

图1 高斯噪声窃听信道的安全有损传输

由于状态信息对编码器非因果性可知，所以可以将Sn看作有限遍历的马尔科夫链，通过最优功率分配函数Υ(·)对信道状态进行优化，求解出最优信道状态功率P*s．

根据拉格朗日乘子和Kuhn-Tucker条件，最优功率分配函数需要满足

其中拉格朗日乘子λ＞0，其实际值可以通过求解

得出，确保满足信道平均输入功率约束．最后得出

根据本文编码机制，Bob接收到的序列为

Eve窃听到的序列为

5.2 速率-失真率-信源估计的最小均方误差

定理2若三元组(R，D，IDE)∈R3+，U=∅，V属于有限集合V中的辅助随机变量且存在马尔科夫链V-(X，F)-(B，E)和V-(F，S)-(Y，Z)则需要满足

证明

（1）速率R

由式（7）可得R≥I(V；F|B)，其中I(V；F|B)=因所以

（2）失真D

（3）信源估计的最小均方误差IDE

由式（8）可得

因此

证毕．

5.3 实验和分析

本节对本文提出的系统模型及其编解码机制的安全性和可靠性进行仿真．仿真中所有信道为独立同分布的衰落信道且服从均值为0和方差为1的高斯分布．合法接收者和窃听者分别观测到的噪声功率是Pb和Pe，合法信道的加性高斯信道噪声功率为Py，窃听信道噪声功率为Pz，信道平均输入功率约束为P，最优信道状态功率Ps*根据式（11）计算得出．

根据构造的高斯噪声窃听信道模型和编码机制，选取以下随机变量

图2 随机变量之间的相互关系

函数关系可表示为

令信道增益g1=g2=1，根据等式得到R、D和IDE的上下界关于α和β的表达式，然后对R、D和IDE定界后分情况进行实验和分析．

（1）R的下界

最后得出R的下界关于α和β的表达式．

（2）D的下界

其中，根据式（17）～（19）可得

根据式（19）和（20）可得

其中，根据式（19）可得

根据式（17）和（20）可得

最后得出D的下界关于α和β的表达式．

（3）IDE的上界

本节将根据合法信道与窃听信道噪声功率的不同以及合法接收者与窃听者边信息传输时噪声功率不同划分为表1所示的4种情况，然后分析本文方案在不同情况下的速率、失真、泄露率和模糊率．其中，情况1表示Bob比Eve的信道噪声小且Bob边信息的噪声比Eve小，信道状态功率取最优值Ps*，是合法接收者相对于窃听者的最优条件．其余3种情况为非最优条件，信道状态功率也取相应的最优值Ps*．

表1 不同噪声功率条件下划分的4种情况

根据表1考虑噪声功率不同的4种情况，将各种情况下的数据代入化简得到的表达式中，速率R，失真D，信源估计的最小均方误差IDE和模糊率Δ的单位是bit/source-bit．本节将寻找速率-失真-信源估计的最小均方误差三者之间的最优权衡点转化为目标值W最大化的优化问题，优化问题表述如下：

其中，atan()为反正切函数，[x]+表示max{0，x}．

情况1：Bob比Eve的信道噪声小且Bob边信息的噪声比Eve小．令Py=0.5，Pz=1，Pb=0.5，Pe=1，P=1．

情况2：Bob比Eve的信道噪声小但Bob边信息的噪声比Eve大．令Py=0.5，Pz=1，Pb=1，Pe=0.5，P=1．

情况3：Bob比Eve的信道噪声大但Bob边信息的噪声比Eve小．令Py=1，Pz=0.5，Pb=0.5，Pe=1，P=1．

情况4：Bob比Eve的信道噪声大且Bob边信息的噪声比Eve大．令Py=1，Pz=0.5，Pb=1，Pe=0.5，P=1．

图3描绘了情况1下目标值W与α和β的函数关系，最优权衡在α=0.1，β=0.9，γ=0.43时取得，此时最大目标值为196.9906，速率为0.7601 bit/source-bit，失真为0.0051 bit/source-bit，信源估计的最小均方误差为0.8427 bit/source-bit．

图3 情况1:传输信道噪声小且边信息噪声小

图4描绘了情况2下目标值W与α和β的函数关系，最优权衡点在α=0.9，β=0.1，γ=0.43时取得，此时最大目标值为51.1407，速率为0.6305 bit/source-bit，失真为0.0198 bit/source-bit，信源估计的最小均方误差为0.7202 bit/source-bit．

图4 情况2:传输信道噪声小但边信息噪声大

图5描绘了情况3下目标值W与α和β的函数关系，最优权衡点在α=0.9，β=0.1，γ=0.43时取得，此时最大目标值为34.6518，速率为0.3285 bit/source-bit，失真为0.0306 bit/source-bit，信源估计的最小均方误差为1.2815 bit/source-bit．

图5 情况3:传输信道噪声大但边信息噪声小

图6描绘了情况4的目标值W与α和β的函数关系，最优权衡点在α=0.9，β=0.1，γ=0.43时取得，此时最大目标值为29.2453，速率为0.3998 bit/source-bit，失真为0.0367 bit/source-bit，信源估计的最小均方误差为1.2079 bit/source-bit．

图6 情况4:传输信道噪声大且边信息噪声大

进一步，分析本文方案在以上4种情况下模糊率的变化情况．图7描绘的是在情况1下模糊率关于α和β的变化情况．当α=0.15，β=0.42，γ=0.8950时，窃听者对信源的模糊率最高，达到0.1410 bit/source-bit．

图7 情况1下的模糊率

图8描绘了情况2下模糊率关于α和β的变化情况．当α=0.15，β=0.42，γ=0.8950时，窃听者对信源的模糊率最高，达到0.1357 bit/source-bit．

图8 情况2下的模糊率

图9描绘了情况3下模糊率关于α和β的变化情况．当α=0.32，β=0.61，γ=0.7249时，窃听者对信源的模糊率最高，达到0.1996 bit/source-bit．

图9 情况3下的模糊率

图10描绘了情况4下模糊率关于α和β的变化情况．当α=0.32，β=0.61，γ=0.7249时，窃听者对信源的模糊率最高，达到0.1945 bit/source-bit．

图10 情况4下的模糊率

综合以上实验结果可以得出：在最优条件下，即Bob比Eve的信道噪声小且Bob边信息的噪声比Eve小，所得目标值达到4种情况下的最大值，速率最大且失真最小，根据信源估计的最小均方误差推算出信息泄漏率为0.1277 bit/source-bit，所得结果比文献［10］中所提出的安全有损信源传输方案中的速率高，比其所得的失真低；信源估计的最小均方误差比文献［11］所提出的最优方案得出的值高．利用速率和失真来衡量其可靠性，信源估计的最小均方误差来衡量其安全性，对比可得本文所提出的传输模型及其编解码方案具有更好的安全性和可靠性．

在非最优条件下，例如第2种情况，Bob比Eve的信道噪声小，但Bob边信息的噪声比Eve大时，速率和信源估计的最小均方误差都减小且失真增大；情况3和情况4下，目标值都相对减小，但情况4的目标值最小，因此本文方案在情况4下性能最差．进一步分析可得边信息的噪声功率对有限码率约束域的影响比信道噪声的影响小．此外，在情况3下，即传输信道噪声大但边信息噪声小时，模糊率最高可达0.1996 bit/source-bit．其它3种情况下的模糊率也比文献［10］所提方案的模糊率0.1330 bit/source-bit要高，原因是利用双分簇技术构造的二维码本进行编解码时码字具有更高的隐蔽性．

6 结论

本文构建了窃听信道下具有边信息和状态信息的信源安全有损传输模型，根据该模型设计了基于双分簇技术的编解码机制，并推导出传输速率-失真-信息泄露率这三个有限码率约束的下界．随后考虑现实噪声问题，分析了该模型下的高斯噪声窃听信道．仿真实验结果表明当合法信道比窃听信道噪声功率小且合法接收者比窃听者的边信息噪声小时，传输速率-失真-信息泄露率之间的权衡最优，此时速率为0.7601 bit/source-bit，失真为0.0051 bit/source-bit，信息泄露率为0.1277 bit/source-bit．在非最优条件下，当传输信道噪声大但边信息噪声小时所提方案可以达到更高的模糊率.