计算机电磁指纹提取和识别技术研究

2022-05-27 16:19刘壮李陆杨轩
计算机时代 2022年5期

刘壮 李陆 杨轩

摘  要: 计算机电磁泄漏引发的信息安全问题日益严峻。计算机除了会通过电磁波泄漏处理的信息内容之外,也会泄漏反映计算机个体唯一性的指纹特征,称为电磁指纹。由于内部硬件结构与工艺差异,不同计算机个体具有不同的电磁指纹。为此,分析了计算机电磁指纹产生的原因及表现形式,构建简化的计算机电磁泄漏信号产生模型,并基于产生模型将线性预测分析算法应用于计算机电磁指纹提取,最后基于电磁指纹实现计算机身份唯一性鉴别。分析结果表明,利用线性预测系数可以在复杂电磁环境中成功鉴别出计算机个体。

关键词: 电磁信息安全; 电磁泄漏; 电磁指纹; 线性预测分析; 计算机个体识别

中图分类号:TN924;TP309          文献标识码:A      文章编号:1006-8228(2022)05-19-06

Research on electromagnetic fingerprint extraction and

identification technology of computer

Liu Zhuang Li Lu Yang Xuan

Abstract: The information security issues caused by computer electromagnetic leakage are increasingly serious. In addition to the information content leakage by the electromagnetic wave, the computer will also leak the fingerprint feature information that reflects the uniqueness of the computer which called electromagnetic fingerprint. Different computers have different electromagnetic fingerprints due to the internal hardware structure and process difference. In this paper, the causes and manifestations of computer electromagnetic fingerprints are analyzed, and a simplified computer electromagnetic leakage signal generating model is constructed. Based on this model, the linear prediction analysis algorithm is used to extra the computer electromagnetic fingerprint and identify computer individual. Results show that computer individuals can be successfully identified in complex electromagnetic environments by using linear prediction coefficients.

Key words: electromagnetic information security; electromagnetic leakage; electromagnetic fingerprint; linear prediction analysis; computer identification

引言

以計算机为主的信息设备在工作时会产生不同程度的电磁泄漏信号,这类信号中可能含有设备处理的敏感信息,通过一定的设备和算法可将其接收还原,因此对计算机电磁泄漏发射的安全防护尤为重要。计算机电磁泄漏信号中除了包含其处理的信息内容外,还包含能反映出设备身份唯一性的指纹特征,即电磁指纹。研究计算机电磁指纹提取与计算机个体唯一性鉴别,可应用于电磁信号监测、信息泄漏发射源确定、恶意改装设备和恶意硬件植入设备检测,实现对计算机有针对性地管控和防护,这对我国信息安全保密具有重要的意义。

基于计算机电磁泄漏信号提取电磁指纹进而识别计算机个体与基于电磁信号识别无线通信设备类似,后者称为特定辐射源识别(Specific emitter identification,SEI)。辐射源识别技术是通过信号处理方法从接收的电磁信号中提取出不同辐射源的本质差异信息,从而分辨通信辐射源个体,这一概念最早由美国军方提出。在国内外传统的辐射源识别研究中,多提取设备的开机瞬态电磁信号特征或稳态电磁信号特征,所用算法多为分形维数、小波变换、时频分析等算法[1],这些算法大都基于由设备主动发射的调制信号。与通信辐射源电磁指纹提取不同的是,计算机电磁指纹的提取是基于计算机在工作时无意识泄漏出去的宽带信号,其信号微弱、频率成分复杂,同时又容易受到背景噪声和环境响应的影响[5]。计算机电磁泄漏信号从检测、接收、采集到特征分析都和通信辐射源有巨大差异,相关公开的研究工作也较少。

最近两年在RFID领域出现了类似的研究,研究人员试图提取各种电子产品固有的电磁指纹来取代额外的RFID身份标签[6],C.Yang和A.P.Sample利用近场天线采集各种电子玩具、手机和笔记本在0~500KHz频段的低频电磁噪声信号,利用高维余弦相似度对各种设备进行鉴别,正确率从70%~90%不等。Mo Fan等采用支持向量机的方法以频谱幅度为特征对LCD显示器进行分类[7];2017年,Sun-Degang和Shi Jun等分别研究了高阶累积量和频谱质心两种指纹特征在计算机主机和LCD显示屏个体识别中的应用,在一定的信噪比下,识别率达到了90%[8]。2021年,裴林聪等人基于深度学习模型实现对不同分辨率来源电磁泄漏信号的识别[9]。

目前对计算机电磁指纹提取的研究整体较少,所提出的电磁指纹主要针对内容相关(显示器显示的内容保持不变)下的计算机识别,无法应对复杂多变电磁环境以及内容无关(显示器显示不同内容)时的计算机个体识别。为了能从复杂的电磁泄漏信号中提取计算机电磁指纹,本文分析了计算机电磁泄漏信号中与个体身份唯一性有关的特征,构建出简化的电磁泄漏信号产生模型;基于此模型从电磁泄漏信号中提取出不受计算机视频信息影响的电磁指纹,最后实现计算机个体识别。

1 计算机电磁指纹产生机理分析

1.1 计算机视频信号对电磁泄漏信号的影响

计算机显示输出视频信号的包络是具有一定周期的脉冲波形[10],如图1所示。由于脈冲信号具有一定的上升沿和下降沿时间[τr],该周期脉冲实为周期梯形波。其中A为脉冲幅度,[τ]为梯形波脉冲宽度,为显示器扫描一行所需时间;显示器从一行扫描到下一行时会有一段消隐时间,因此脉冲周期T要略大于脉冲宽度。

这里直接给出计算机视频信号的对数功率谱[11]。

梯形波功率谱包络大致可分成三部分:第一部分近似一条水平直线,第二部分和第三部分为斜率不同的直线,如图2所示,两个拐点频率分别为[1/τ]和[1/τr]。

通过对计算机电磁泄漏信号的接收还原可以恢复计算机屏幕显示的信息[12]。因此,电磁泄漏信号直接携带计算机显示输出的视频信息。如图3所示,在相同频段下同一计算机在显示三种不同内容时电磁泄漏信号功率谱存在明显差异。

1.2 计算机整机辐射性能对电磁泄漏信号的影响

计算机电磁泄漏信号是计算机视频信号通过主机、视频线缆和显示器的共同作用辐射出去,而不同材质、长度的视频线缆的辐射能力存在差异,不同的主机和显示器个体对于视频线缆来说相当于不同的负载,对视频线缆的辐射也会产生一定影响[13],如图4所示,在相同频段下不同计算机在显示同样内容时的电磁泄漏信号功率谱也存在明显差异,这类差异可以归结于计算机整机辐射性能差异,由计算机硬件结构、生产工艺等计算机固有特性所影响。因此,计算机整机辐射性能特征是一种计算机身份唯一性标识。

综上,计算机电磁泄漏信号中既携带了计算机视频图像特征,又包含计算机整机辐射性能特征。其中视频图像特征是和计算机个体身份唯一性无关的特征,在后续特征提取中应消除其影响;计算机整机辐射性能是计算机电磁指纹产生的原因。因此,本文构建以下电磁泄漏信号产生模型,如图5所示。

图5中[u(n)]代表计算机视频信号,[h(n)]表示计算机整机作用的冲击响应,[s(n)]为直接观测到得电磁泄漏信号。这里将计算机整机作用看做一个线性系统,电磁泄漏信号是计算机视频信号混杂着背景噪声,经过计算机整机的辐射而产生。

2 基于线性预测分析的电磁指纹提取

根据上述分析,计算机视频信号[u(n)]包含了与电磁指纹无关的信息内容特征,[hn][h(n)]只包含计算机整机辐射性能特征,因此提取[h(n)]特征也就提取出一种计算机电磁指纹。根据上一章分析计算机电磁泄漏信号可简化为一个周期梯形波经过一个线性系统所产生,根据线性系统的原理,计算机电磁泄漏信号在某个时刻的采样值可以用之前时刻的采样值线性组合来逼近,从而对电磁泄漏信号的波形进行估计和预测,这就是线性预测分析的原理。

为了确定一个电磁泄漏信号样本的预测系数,需要让线性预测值和实际信号采样值之间的均方误差最小,这一组系数即为线性预测系数(Linear Prediction Coefficient, LPC)。

根据上述思想,如果用某一时刻n的前p个采样值[{s(n-1),s(n-2),...,s(n-p)}]的线性组合来预测这一时刻的取样值[s(n)],得到的预测信号[s(n)]为:

其中[ak]即为线性预测系数。为了使预测效果最优,需要使预测误差均方值最小,基于此设定建立方程,求解方程就可以求得线性预测系数[ak],它消除了计算机视频信号的影响,是计算机整机辐射特性参数的表征,因此线性预测系数可以用来计算机电磁指纹提取。

3 计算机个体识别算法

3.1 基于支持向量机(Support Vector Machine,SVM)的计算机个体识别算法

图6为计算机电磁泄漏信号采集与电磁指纹提取流程。使用双锥天线接收计算机电磁泄漏信号,通过IQ变换采集到时域电磁泄漏信号,经过分帧、加窗等预处理操作,对每一帧信号提取LPC,最后再将各帧LPC组合,即可得到每一个采样样本的电磁指纹。最后基于提取的电磁指纹选择合适的分类器进行判别分析。

本文和文献[8]中提出的频谱质心(SC)算法进行对比,分别进行了单一时间地点下内容相关(情况1)、内容无关(情况2)的个体识别、多时间多地点内容无关(情况3)的个体识别。表1是采用SVM对五台计算机的识别结果:对于单一时间环境下内容相关的计算机个体识别(测试时计算机显示的信息内容和训练时显示的信息内容一致),两个特征的平均识别率在90%以上;对于单一时间环境下内容无关的个体识别(测试时计算机显示的信息内容和训练时显示的信息内容不一致),两种特征的识别率都有所下降,相比之下本文采用的LPC特征效果更好;对于多时间、多地点采集的计算机电磁泄漏信号,两类特征的识别性能都大幅降低至75%以下。

究其原因,计算机电磁泄漏信号不仅会受到背景噪声的干扰,同时信号采集设备、电磁波在房间中的多径效应都会带来非线性干扰,这些干扰都可以看作是“信道无关项”。为了消除信道无关项的干扰,本文采用高斯混合模型-身份认证矢量-概率线性判别分析(UBM-i-vector-PLDA)算法来对计算机电磁指纹识别。UBM-i-vector-PLDA算法可以有效消除信道无关项的干扰,已成功应用于声纹识别等领域[14]。

3.2 基于UBM-i-vector-PLDA的计算机个体识别算法

一个基于UBM-i-vector-PLDA的计算机个体识别系统应该包括如下三个阶段。

⑴ 首先要训练高斯混合-通用背景模型(GMM-UBM)。所谓UBM模型是将所有背景设备的电磁信号数据看成同一台设备的,将其训练成一个大的GMM模型,目标设备的GMM模型则是在UBM模型上进行个性适应得到。这种UBM模型很好地解决了电磁信号样本不足情况下训练的GMM模型阶数较低无法有效拟合电磁信号特征的空间概率密度分布的问题。

在背景训练阶段,采集大量计算机电磁信号数据作为背景训练数据,这里可以将主机、显示器和视频线缆相互组合形成更多数量的计算机个体以解决训练样本不足的问题。本文将5台计算机主机、5台显示器和10条计算机视频线缆随机组合,然后利用背景计算机电磁信号提取LPC特征,再训练GMM-UBM模型得到背景计算机的均值超矢量。

⑵ 注册阶段,对新的若干计算机个体提取LPC特征,在已经训练好的UBM的基础上,通过最大后验概率算法进行参数微调,最后求注册计算机的身份认证矢量i-vector,这里用model_iv表示。已经注册好的计算机便存在于电磁指纹库中。

⑶ 测试阶段,对一台已经存在于电磁指纹库中但型号未知的计算机,采用同样的方法提取特征求i-vector,用test_iv表示。最后再利用概率线性判别分析(Probabilistic Linear Discriminant Analysis,PLDA)对test_iv和model_iv进行打分判决。

整个系统框图如图7所示。

4 實验结果分析

UBM-i-vector-PLDA系统在训练和测试的流程中涉及到一些参数,下面将研究这些参数对系统性能的影响。

4.1 训练样本采样时长、采样率对系统性能影响

样本信号采样时间越长包含的信息量越多,系统性能越好。而当采样时间超过0.016S时,系统性能几乎不再变化,主要原因就是测试时计算机显示器场刷新频率为60Hz,0.016S已经接近一场视频信号的时长,因此采样时间大于0.016S时信号存在冗余。因此样本采样时长取一场视频信号的时长最合适。

信号采样带宽越大,频率分量越丰富。对于计算机电磁泄漏信号还原的最低带宽通常为5MHz,此时电磁泄漏信号已经可以还原出视频信息,即可满足训练样本的最低采样率要求;而受限于接收机的性能,采样率最高只能达到40M,因此最佳带宽选取20MHz;随着带宽的增加,采样率成倍增加,每条样本占用内存也成倍增加,严重影响系统效率。

4.2 UBM计算机个数和测试计算机个数对系统性能影响

背景训练阶段采用7台计算机主机、7台显示器和10条视频线缆随机组合,每种组合方式代表一个计算机个体;注册和测试阶段需采用不同于训练阶段的组合方式。实验中UBM计算机个数分别为20、30、40、50,注册、测试计算机个体数分别为2、3、4、5、6、8、10、15,下面将研究不同UBM计算机个数对系统性能的影响。

如图8所示,图的横坐标表示训练和测试计算机个数,纵坐标表示平均等错误率(Equal Error Rate,EER),不同折线表示不同的UBM计算机个数。由图可以看出,当注册和测试样本个数保持一定时,随着UBM计算机个数的增加,系统EER在不断降低;当UBM计算机个数达到40 时,系统性能趋于稳定,若继续增加训练样本个数性能提升效果可能并不明显。当UBM计算机个数保持一定时,随着注册和测试样本的增加,系统EER逐渐上升,即性能逐渐下降;而当UBM计算机个数较多(不少于40)时,测试计算机个数的增加对系统EER影响较小。因此,UBM计算机个数选取40为最佳。

为了测试信道干扰对系统性能的影响,本文从不同时间段、不同实验环境下采集电磁信号进行训练。图9是单日采集的数据和多日采集的数据训练和识别效果(采样时常0.016S,采样带宽20MHz,UBM计算机个数为40,注册计算机个数为5):

电磁泄漏信号识别结果混淆矩阵

图9分别是同一天三个房间采集的电磁信号和不同天三个房间采集的电磁信号提取LPC特征在内容无关的情况下训练和测试的结果。从混淆矩阵中可以看出,单日多地点采集的信号由于房间响应、环境噪声等并无变化,因此系统的平均识别率较高,达到90.68%;对于多日、多地点采集的数据训练识别结果虽然有所降低,但依然保持了88.95%的平均识别率。因此本文提取的LPC特征和采用的UBM-i-vector-PLDA模型可对计算机个体唯一性进行有效鉴别。

5 结束语

本文基于电磁信息安全的角度研究了计算机电磁泄漏信号电磁指纹提取方法和基于电磁指纹的计算机个体唯一性鉴别。本文首先定性分析了计算机视频信号和计算机整机辐射性能对电磁泄漏信号的影响,确定影响计算机电磁指纹产生的因素,并构建计算机电磁泄漏信号产生模型;基于构建的模型,采用线性预测系数分析电磁泄漏信号特征,提取计算机电磁指纹;最后采集不同时间、不同环境的计算机电磁泄漏信号提取电磁指纹,利用UBM-i-vector-PLDA算法对电磁指纹进行分类识别。

实验结果证明,本文提出的电磁指纹提取算法可有效鉴别出计算机个体。后续应进一步研究计算机电磁指纹产生机理,给出计算机电磁指纹定量化地描述,以便更有加针对性地提取电磁指纹。此外,本文的研究都是针对单个计算机采集的信号,不存在多台计算机电磁泄漏信号混淆在一起的情况。因此需要进一步结合信号分离技术对多计算机信号混淆的情况进行分离和识别。

参考文献(References):

[1] H. Choe, C.E. Poole, A.M. Yu. Novel Identification of

Intercepted Signals from Unknown Radio Transmitters[C]. Proceedings of SPIE, the International Society for Optical Engineering,1995, 2491:504-516

[2] D. Shaw, W. Kinsner. Multifractal Modelling of Radio

Transmitter Transients for Classification[C]. IEEE Proceedings of ICCPC97,1997:306-312

[3] GILLESPIE B W, ATLAS L E. Optimizing time-frequency

kernels for classification[J]. IEEE transactions on signal processing,2001,49(3):485-496

[4] 许丹.辐射源指纹机理及识别方法研究[D].国防科技大学,

2008

[5] Yukio Yamanaka, and Kaori Fukunaga. Method for

Determining Whether or Not Information is Contained in Electromagnetic Disturbance Radiated From a PC Display[J].IEEE transactions on Electromagnetic Compatibility,2011,53(2):318-324

[6] C.Yang ,A.P.Sample. "EM-ID: Tag-less identification of

electrical devices via electromagnetic emissions"[C]. Proc. IEEE Int. Conf. RFID (RFID). Orlando,2016(5):1-8

[7] Mo Fan,Luyinghua, Zhangjinling, et al.Support vector

machine foridentification of monitors based on their unintended electromagneticemanation[J],Progress In Electromagnetics Research M,2013,46(3):211-224

[8] Sun Degang, Shi Jun, Wei Dong, Zhang Meng. A New

method to recognize computer through electromagnetic radiation[C].Asia-Pacific international symposium on electromagnetic compatibility. Shenzhen,2016

[9] 裴林聰,张游杰,马通边,等.基于深度学习的计算机显示器电

磁信息泄漏识别[J].计算机系统应用,2021, 30(8):7

[10] Kuhn M G. Electromagnetic Eavesdropping Risks of

Flat-Panel Displays[C].Proceedings of the 4th international conference on Privacy Enhancing Technologies. Springer Berlin Heidelberg,2004.

[11] Wang L,Yu B. Research on the compromising

electromagnetic emanations from digital signals[C]. International Conference on Automatic Control & Artificial Intelligence. IET,2013

[12] 徐艳云,郭佳,李怡伟,等.信息设备电磁泄漏还原图像的文

本识别研究[J].信息安全研究,2016(2):6

[13] 霍宏艳,张晓刚,叶畅,等.HDMI电缆对受试设备辐射骚扰

场强的影响[J].安全与电磁兼容,2018(6):77-80,89

[14] P Kenny. A small footprint I-Vector extractor[C].

Proceedings of Odyssey Speaker and Language Recognition Workshop, Singapore,2012(6)

收稿日期:2021-10-26

作者简介:刘壮(1994-),男,安徽人,硕士,助理工程师,主要研究方向:电磁信息安全、物理空间安全、网络安全测评。