隐蔽无线通信网络传输信息云存储密文检索

2021-11-17 08:37岑,吴
计算机仿真 2021年6期
关键词:密文聚类储存

蒋 岑,吴 迪

(湖北工业大学工程技术学院,湖北武汉 430000)

1 引言

由于无线通信自身存在较强广播性,在传输信息时容易被第三方窃取。近年来,隐蔽无线通信的提出对这一问题取得突破性成果。此种通信方式更加强调对传输过程的保护,减小窃听者检测概率。因其具有服务费用低、使用方便等特点,逐渐发展为用户普遍使用的服务。随之而来的安全问题日渐突出,由于第三方不能完全可信,通信信息需要以密文形式储存。如果文档信息量较大,则用户对所需信息进行检索成为迫切需求。

针对上述问题,文献[1]提出一种基于安全密文区间的检索方案。对密钥矩阵结构进行攻击,同时引入随机数,使方案可以隐藏关键字大小的排列关系,确保关键字索引机密性,实现排列安全和归并特征安全的目的。实验结果证明此方法可有效扩展云储存空间,减少检索时间。文献[2]结合模糊检索特征与要求,构建云储存环境下安全密文模糊检索模型。利用基于通配符与编辑距离的模糊集构成方式,将关键词词频信息当作权值建立Huffman树形索引结构,采用布隆过滤器储存并匹配关键词模糊集;最后,使用改进的TF-IDF规则对检索文档做评价排序,得出用户最满意的结果。实验表明,该方法满足储存规模要求,检索准确度较高。

上述两种方法虽然检索结果能够满足用户期望,但无法实现检索安全与效率平衡。为此本文将改进层次质量聚类(IQHC Improved Quality Hierarchical Clustering)与多关键排序方法相结合,对隐蔽无线通信网络传输信息云储存密文进行检索。该方法不仅建立文件向量,还考虑关键字出现频率与重要性,在进行检索时通过用户对某关键字赋予的权重数值,优先返回用户感兴趣的检索信息,提高检索效率与准确性。此外还可以保护用户隐私,避免攻击者获取通信数据。传输与检索效率不受网络限制,实现安全与效率平衡。

2 隐蔽无线通信信道模型构建

与信息加密技术相比,隐蔽通信可提供更强的数据安全保障。在无线通信过程中,它能够利用一定策略降低通信双方传输过程被窃听方检测出来的概率[3],因此又被称为低检测率通信。在其通信信道模型中包括一个发射方Alice、接收方Bob和一个窃听者Willie。隐蔽通信流程如图1所示。

图1 隐蔽通信流程

发射方若要和接收方之间进行无线通信信息传输,且要保证此过程不被窃听,但由于无线环境具有较强开放性,传输行为存在被检测到的风险。隐蔽通信技术利用信号检测相关原理分析遭到窃听的可能性,构建一个隐蔽的通信网络。接收方获取的接收符号序列[4]描述为yb=[yb(1),yb(2),…,yb(n)],其中

yb(i)=x(i)+nb(i),i=1,2,…,n

(1)

同理可得窃听信道上获取的符号序列表示为yw=[yw(1),yw(2)…,yw(n)],其中

yw(i)=x(i)+nw(i),i=1,2,…,n

(2)

发射方在无线通信环境中将信息按规定发送到接收方,此时窃听者对观测到的信号判断是否发生秘密通信。为准确判断发射方与接收方是否进行通信,窃听者的检测行为可以利用一个二元假设方程[5]描述

(3)

式中,H0是零假设,表示没有检测到有效信号,窃听者只能获取高斯白噪声;H1属于有效假设,窃听者检测到了有效信号与高斯白的混合信号。窃听者检测性一般利用检测概率PD表示,其表达式如下

PD=1-ξ

(4)

式中,ξ=α+β表示总检测错误率,α=PFA(D1|H0)为虚警概率,表示发射者没有传输信息,是由于窃听者的错误判断发生了通信行为;β=PMd=P(D0|H1)为漏检概率,表示发射方进行通信传输,但窃听者并未检测到。D1与D0表示二元检测结果,分别描述发射方传输与未传输的有效信号。

AWGN信道属于一种简单信道模型经常被用作无线通信分析,本文在此基础上构建的通信信道模型如图2所示。

图2 隐蔽通信信道模型图

在图2信道模型中,T表示传输策略,若T=1,发射方将消息M以速度R编码为复值发送符号x=[x(1),x(2),…,x(n)],其中n表示码块长度;若T=0,发射方不会有消息传出,此时传输符号表示为x=[0,0,…,0]。

3 基于改进质量层次聚类的多关键字密文检索

3.1 云储存平台架构与检索系统模型构建

1)云储存平台架构

用户通过无线网络将数据传输到云储存平台,此时不需要自行建立数据中心,避免储存平台重复构建,增加储存成本。云平台结构如图3所示。

图3 云储存平台架构图

由图3可知,云储存架构主要分为储存层、管理层、接口层以及访问层。其中储存层为该架构最底层,主要包括硬件储存设备与管理系统。该层次利用相同管理系统将不同类型储存设备连接,实现海量通信数据的统一管控[6]。

2)密文检索系统模型

检索系统主要模块如图4所示。

图4 检索系统主要模块

在检索系统主要模块环境下,构建密文检索系统模型,此模型中包含云储存平台、数据拥有者以及授权用户群三个实体,如图5所示。

图5 云储存环境下检索系统模型

该系统运行流程为:数据拥有者将密文集合发送到云储存平台,然后数据拥有者认证并授权能够访问的用户,并将生成的密钥发放给每一位成员。当用户需要检索储存信息时,利用密钥生成检索陷门[7],并将陷门传输到云端,云平台接收后,开始进行查询,最终将检索结果反馈给用户。

3.2 云储存密文聚类处理

在储存环境下对密文进行检索,信息向量维度高、冗余维度较多,其信息分布稀疏,造成计算开销大,检索效率低。为改善这一现象,本文对质量层次聚类方法进行改进,改进后的聚类过程如下所示。

步骤一:生成样本数量为N的文件向量B1,B2,…,BN,其中BN=(b1,b2,…,bq)属于q维向量,若N>q时,构建样本矩阵,对该矩阵中的元素进行下述变换生成标准样本矩阵Zij

(5)

步骤二:利用下述公式计算Zij的协方差矩阵C

C=(ZtZij)/(N-1)

(6)

式中,Zt为Zij的转置矩阵。

步骤三:利用奇异值分解方法获取矩阵C的特性方程|C-λIe|=0,获得e个特征根,将这些特征根从大到小进行排序[8],并根据公式(7)中贡献率η计算主成分数量

(7)

计算η的值,对于任意一个特征根λj(j=1,2,…,f),对方程组Rb=λjb进行求解,获得f个特征向量bj(j=1,2,…,f)。

步骤四:将经过标准化处理的数据变量变换为主成分

(8)

式中,U1表示第一主成分,U2表示第二主成分,依次排列。对文件向量通过新的主成分描述出来,获得经过降维后的文件向量。

步骤五:假设E表示文件中最大聚类数量,相关性最小的阈值计作min(S),通过欧式距离判断文件之间相关性与文件和聚类中心的相关程度[9]。

步骤六:对降维后的文件向量聚类。如果聚类数量k不稳定,则增加一个新聚类中心。分别选取聚类中相关程度最小的分数min(St)和相关程度最小阈值min(S)进行对比,如果min(St)

步骤七:令上一步骤形成的聚类中心集合当作第一级聚类中心C0,逐个判断每个聚类中心包含的文件个数,如果数量超出此前设定的阈值E,将此聚类分割为多个子聚类;反之不进行子聚类划分。将划分出的子聚类当作下一级聚类,反复执行步骤七,直到所有聚类数量均符合阈值设定要求。

步骤八:重复以上步骤,直到全部聚类都满足相关性与数量要求,完成聚类处理。

3.3 多关键字检索实现过程

综合考虑安全性需要,在检索过程中需要隐藏一些索引词和文件之间的联系,但是这会导致检索结果失去有序性。为解决这一问题,本文建立一个用户兴趣模型,该模型包括用户基本信息与密文兴趣向量两部分,如图6所示。

图6 用户兴趣模型

在构建用户检索兴趣模型后,通过用户定义关键字权值对密文进行检索。在云储存下,多关键字检索实现过程如下:

步骤一:对聚类过程中获得文件向量利用关键字权重值对其表示,生成字典Fw与文件向量集合F。

步骤四:用户选取一种较为安全的方式对文件加密,将加密后的文件集合与之前形成的文件及聚类索引共同发送到云服务器。

步骤六:用户将陷门OW传输到云服务器,云端利用内积方程计算相关分数Score,计算公式如下

Score=Ic×Ow

(9)

云端利用上述公式先获取陷门与聚类索引向量中一级聚类中心的内积,找出评分最高聚类中心;其次计算陷门和子聚类中心的内积[10],获取第二级聚类中心。以此类推;最后得到陷门和密文索引向量的内积,从而将得分最高的密文反馈给用户,完成密文检索。

4 仿真分析

本次仿真对所提算法、文献[1]方法、文献[2]方法进行性能对比。为确保实验精准性,不考虑次要因素对实验的影响,例如网络带宽、稳定性等因素。实验设备包括服务器两台、客户端一台,将通信传输信息储存在云端。其索引过程流程如图7所示。

图7 仿真检索过程图

依据图7过程,分别生成1000、2000、3000、4000、5000kB的不同规模文件,利用三种方法对其检索,所用检索时间如表1所示。

表1 不同方法密文检索时间对比表

由表1测试结果可知,在文件大小相同情况下,本文方法密文检索时间最短,且随着文件规模扩大,所需检索时间增长幅度较小,检索效率高于其它两种方法。主要因为利用改进的质量层次聚类方法降低了云储存中信息维度,减少冗余数据,因此提高检索效率。

密文检索的安全性主要表现在索引中关键词数量、陷门的不可区分性、检索模式以及相关程度分数方面。表2为三种方法在安全方面的对比结果。

表2 不同方法安全性对比表

由表2可知,本文方法满足所有安全性要求,而其它两种方法在个别性能中无法保证检索安全。主要由于所提方法在检索过程中,利用可逆矩阵对索引向量进行加密处理,不会泄露关键词与文件之间的相关性,

陷门与检索结果的映射关系被很好保护,确保检索安全。

5 结论

5G时代到来,促使智能终端构建出复杂多维的无线通信网络。随着云存储应用与发展,通常将通信网络传输信息储存在云端。为实现隐蔽无线通信传输信息云储存的安全高效检索,本文将改进的质量层次聚类与关键词排序方法相结合,减少云储存中冗余通信信息,对检索行为进行加密处理,实现了检索效率与安全性相平衡。但为满足用户更多需求,在今后研究中需要扩展其它功能,例如模糊搜索、支持动态更新等。此外还可以与密码学相结合,进一步提高检索安全性。

猜你喜欢
密文聚类储存
一种傅里叶域海量数据高速谱聚类方法
储存聊天记录用掉两个半三峡水电站电量
一种支持动态更新的可排名密文搜索方案
基于知识图谱的k-modes文本聚类研究
基于数据降维与聚类的车联网数据分析应用
嵌入式异构物联网密文数据动态捕获方法
基于模糊聚类和支持向量回归的成绩预测
一种新的密文策略的属性基加密方案研究
一种抗攻击的网络加密算法研究
松鼠怎样储存食物