基于分段马尔可夫模型的频谱占用预测方法

2020-07-25 02:57刘栩楠何彬彬
无线电工程 2020年8期
关键词:马尔可夫周期性分段

刘栩楠,石 荣,何彬彬,陈 敏

(1.电子科技大学,四川 成都 611731;2.电子信息控制重点实验室,四川 成都 610036)

0 引言

随着无线电技术的发展,各种各样的电子信息装备大量应用,对频谱资源的需求也大大增加。传统的频谱分配方式存在很大弊端,表现在大部分频段分配给了固定用户,各频段的使用状况存在很大差异,利用率为15%~85%不等[1]。部分频段的通信需求逐年增加,频谱资源越来越紧张;同时也存在大部分利用率不高的频段[2-4],造成了频谱资源的浪费。如果允许其他用户在不影响主用户用频的前提下使用利用率不同的频段,就可以在很大程度上改善频谱资源浪费的问题。认知无线电(Cognitive Radio,CR)[5]是解决这类问题的主要方法。在CR中,频谱占用预测技术可以有效地帮助认知用户感知频谱状态,得到了广泛的关注和研究。

常用的频谱预测模型有马尔可夫模型[6-10]、基于机器学习的预测模型[11-12]以及自回归模型[13]等。Saleem[14]对CR相关文献使用模型的频率做了统计,其中基于马尔可夫模型的预测方法原理简单,易于建模,并且可以实现不间断地预测,其相关文献数量占比最高,达到了27%。2009年Ghosh[15]使用寻呼频段的监测数据验证了用户的频谱使用状态数据中马尔可夫链的存在。在频谱预测中最常用的是两状态马尔可夫模型,信道状态分为占用和未占用。有一些研究[6-7]把认知用户占用信道的状态考虑到建模过程中,提出了建立多个状态的马尔可夫模型,更符合实际情况,但是对频谱的状态感知[16]提出了更高要求。由于频谱感知过程不可避免地产生误差,观测到的频谱状态不能反映频谱的真实状态,所以隐马尔可夫模型也被广泛用于频谱预测[8-9]。此外还有连续时间马尔可夫模型[9]和Semi-Markov模型[10]在频谱预测中的应用。

构建马尔可夫模型的数据需要满足状态转移规律保持稳定的条件[17]。本文通过分析频谱特点,针对传统马尔可夫模型应用到特定频段的缺陷,从建模数据考虑,提出了基于分段马尔可夫模型的频谱占用预测方法,并结合成都地区的实测频谱数据进行了频谱的预测分析。

1 基于马尔可夫模型的频谱占用预测方法

频谱占用预测是一种通过分析频谱监测产生的历史数据获取频谱使用规律,并用以预测未来频谱占用状态的方法。马尔可夫过程是一类随机过程,它的原始模型是马尔可夫链,由俄国数学家Andrey A.Markov于1907年提出。马尔可夫过程是指目标过程中状态的转移只依赖于之前的N个状态,而与N个状态之前的状态无关,该过程如式(1)所示[18]。对应的N阶马尔可夫模型是指下一时刻的状态仅与最近的前N个时刻的状态有关,而与更早的状态无关,并在此基础上建立的状态转移矩阵。

P{Xn+1=xn+1|X0=x0,X1=x1,…,Xn=xn}=

P{Xn+1=xn+1|Xn-N+1=xn-N+1,Xn-N+2=

xn-N+2,…,Xn=xn},

(1)

式中,“0,1,…,n,n+1”表示不同的时刻;“x0,x1,…,xn,xn+1”表示对应时刻的状态。

利用该过程的特点建立马尔可夫模型,即可根据当前状态对未来状态进行预测。该模型可以通过状态向量和状态转移矩阵描述。将其应用到频谱占用预测时,用“0”表示频谱空闲状态,“1”表示频谱占用状态。以一阶马尔可夫模型为例,其状态向量和状态转移概率的关系如图1所示。

图1 一阶马尔可夫模型Fig.1 First-order Markov model

图1中,P01表示状态“0”转移到状态“1”的概率,以此类推。根据历史频谱数据的状态转移序列可以统计图中的4个状态转移概率,这4个状态转移概率组成的状态转移矩阵构成了马尔可夫模型。根据当前时刻的频谱状态对应状态转移概率的大小可以预测下一时刻的频谱状态。

2 基于分段马尔可夫模型的频谱占用预测 方法

在传统的基于马尔可夫模型的离散时间频谱状态预测中,使用历史数据建立状态转移矩阵,并假设该矩阵相对稳定,随时间变化较小。如果统计足够多的历史数据,根据当前时刻信道的状态,结合状态转移矩阵即可对下一时刻的信道状态进行预测。以移动通信信号的频谱占用为例,通信都是依赖某个特定的频段完成,将频谱数据按频段划分为多个信道,信道的占用与频谱占用具有对应关系。观察2个有代表性信道中的信号强度随时间的变化,如图2所示。

图2 典型信道的信号强度Fig.2 Signal intensity diagram of typical channel

图2中,电平值是频谱监测设备采集到的该频段的信号强度;信道占用度是指一段时间内有信号占用的时间所占的比例[19],有无信号占用可以根据电平值判断。由图2可以看出,信道占用度在时间上是不稳定的,在不同的时间段有明显变化。由于信道占用度的变化较大,使用占用度差异较大的数据建立马尔可夫模型,它们的状态转移矩阵可能存在较大的差异,而通过统计全部的历史数据建立状态转移矩阵就会忽略这种差异。

图2(a)的信道占用度变化具有明显的以24 h为周期的周期性。由于信道占用度有周期性,并且其周期变化特点可以通过历史数据得到,所以对于这类信道,如果分段建立马尔可夫模型,即先把历史数据按状态转移矩阵的差异做分段处理,再使用各段数据分别建立马尔可夫模型或许能够更好地描述数据的统计规律。据此提出基于分段马尔可夫模型的频谱占用预测方法,主要应用在占用度存在周期性的信道中。基于分段马尔可夫模型的信道占用预测流程框图如图3所示。

图3 基于分段马尔可夫模型的信道占用预测流程Fig.3 Flow chart of channel occupancy prediction based on segmented Markov model

建模和预测过程即逐信道建立传统的马尔可夫模型并利用该模型进行预测。下面介绍周期性信道的筛选方法和数据分段建模方法。

2.1 周期性信道筛选方法

先把频谱数据按信道划分,然后逐信道分析。以周期为1天的数据为例,假设各信道采集信号的时间间隔固定,每天采集y个信号占用度,x(x>1)天的数据表示为矩阵A:

(2)

式中,Axy为第x天的第y个占用度数据,其中Ai=[A1iA2i…Axi]T表示在不同周期内分别采集的第i个占用度组成的列向量。

信号的周期性指标为:

(3)

指标V越小,表示信号的周期性越好。

2.2 数据分段建模方法

部分信道的占用度具有周期性,由于占用度是对1/0(有/无信号占用)状态的统计值,所以本文假设占用度周期性较好的信道在每个周期内的1/0分布类似,即对每个周期的状态序列建立马尔可夫模型可以得到相似的状态转移矩阵。如果这个假设成立,在马尔可夫建模过程中,首先使用2.1节方法挑选占用度周期性较好的信道;然后把一个变化周期分为n段;最后把多个周期的训练数据按段分别建立马尔可夫模型。如果分段合理,就可以更好地描述历史数据的统计特性。其分段建模示意如图4所示。

图4 分段建模示意Fig.4 Schematic diagram of segmented modeling

3 实验验证

通过实验验证在占用度具有周期性的信道,统计其不同周期内的占用状态数据可以得到类似的状态转移矩阵。之后检验分段马尔可夫模型效果,并分析分段数n取多少能达到最佳的预测效果。

3.1 数据采集

实验使用中星世通CS-805F可搬移监测测向系统采集频谱数据,天线架设在成都市区某建筑物4楼进行数据采集,主要记录信号的电平值和对应的采集时间。数据采集频段为GSM900下行频段(935~960 MHz),每个信道宽度为150 kHz,信道测量步进为200 kHz,信道数量为126,采集时长为96 h,数据量约为1.7 GB,时隙数约为378 874。

统计实测频谱数据每个信道总体占用度,在126个信道中,66个信道的占用度不超过60%,34个信道的占用度不超过40%。总体来说,GSM900下行频段的总体占用度较低,其利用率仍存在较大提升空间,所以该频段数据适合用于频谱预测实验。

实验中,取前72 h的数据作为训练集,另外24 h的数据作为测试集。为了对比传统马尔可夫模型和分段马尔可夫模型的预测性能,使用训练集数据分别建立2种模型对测试集数据进行预测,并对比分析2种方法的预测结果。

3.2 数据预处理

实验采用阈值法将测量电平值数据转换为信道状态序列。转换方法为[11,20]:

(4)

式中,CS为信道状态;“0”表示信道为空闲状态;“1”表示信道为占用状态;E为实测电平数据;T为噪声阈值。分析采集数据的特征,T=7 dBμV。

每一天的CS序列平均分为100段,分别统计占用度,把CS序列转化为占用度序列之后,带入到式(3)计算每个信道的V值并归一化,得到如图5所示的结果。

图5 各信道的归一化周期性指标Fig.5 Normalized periodic index of each channel

有些信道的频谱数据用式(4)处理后,其CS状态序列几乎为全0或者全1。如果使用马尔可夫模型预测这些信道会达到接近100%的正确率,但是这种预测没有意义,反而会影响评估预测方法的性能,所以在后续实验中,将状态“1”占比大于99%或者小于1%的信道排除掉。经过这一步筛选之后,适合用于频谱预测实验的信道有84个。在这84个信道中挑选出归一化V值大于0.4的信道,观察这些信道的实测频谱数据,发现其占用度序列的周期性确实较差,所以在后续实验中将这些信道标记为周期性较差的信道。最终得到周期性较好的信道59个,周期性较差的信道25个。其中周期性较好的59个信道的编号为:2~15,20,38,40,42~55,81~91,94,106,110,112,114~126;周期性较差的25个信道的编号为:56~79,113。

3.3 实验结果及分析

3.3.1 验证占用度周期性较好信道不同周期内的数据具有类似的状态转移矩阵

以一阶马尔可夫模型为例,其状态转移矩阵包括0→0,0→1,1→0,1→1四个状态转移概率。建模数据包括72 h,3个周期的CS序列,分别建模可以得到3个状态转移矩阵。计算3个矩阵中对应状态转移概率的标准差并求和,记为S。分别计算每个信道的S,作S与对应信道周期性指标V的散点图并进行线性拟合[21],如图6所示。

图6 S与周期性指标V的散点Fig.6 Scatter plot of S and periodic index V

由图6可以看出,S和V呈现出明显的正相关关系。V指标越大代表该信道的占用度数据越不具有周期性,同时其对应的S也越大,表示其不同周期的状态转移概率的标准差越大,即状态转移概率波动越大。所以占用度越具有周期性的信道,其马尔可夫模型的状态转移概率波动越小,对应的在不同周期内的数据建立的马尔可夫模型状态转移矩阵越相似,从而验证了在2.2节中的假设。所以分段建立马尔可夫模型是可行的。

3.3.2 分析分段马尔可夫模型的预测效果

首先使用周期性较好的59个信道的数据建模并预测。按照2.2节的方法把训练集数据分段建立马尔可夫模型,数据分段采取平均分段的方式,即把一个周期平均分为n段,然后把模型应用到对测试集的预测中,统计分段数n与对应的预测正确率,其关系如图7所示。图7中的横坐标最小值都是1,即为传统的马尔可夫模型。图7(a)中n的取值范围较大(1~1 000),展示了预测正确率和分段数n的相对变化趋势。其中正确率在n取1和50两个点之间变化较大。图7(b)详细展示了n取1~50之间所有整数取值对应的预测正确率,其中当n取33时,预测正确率最高达到了74.39%,相对于传统马尔可夫模型的71.42%提高了2.97%。

图7 周期性较好信道的分段建模预测结果Fig.7 Prediction results of segmented modeling for better periodic channels

使用周期性较差的25个信道的数据建模并预测。统计分段数n与对应的预测正确率,其关系如图8所示。

图8 周期性较差信道的分段建模预测结果Fig.8 Prediction results of segmented modeling for worse periodic channels

n取1时,即采用传统马尔可夫模型时得到的预测正确率最高。对于占用度序列周期性较差的信道,分段马尔可夫模型不能提高其预测性能。

综合图7和图8来看,使用2.1节的方法筛选出占用度周期性较好的信道,并在这些信道使用分段马尔可夫方法可以提高其频谱状态预测性能,但是该方法不适用于周期性较差的信道。同时,图7(a)中预测正确率随着n值的增加呈现先上升再下降的趋势。上升主要是因为分段之后,每一段分别建模能更好地描述该段数据的统计规律。随后随着n值再增加,预测正确率下降可能是因为随着分段数n越来越大,分段建立的马尔可夫模型对历史数据的刻画越来越精细,但是丢失了训练数据和测试数据之间的共性统计规律,导致马尔可夫模型对历史数据的过拟合。

分段数n的最佳取值与频谱占用序列每个周期内的0/1分布有关,本文n取33能达到最佳的预测效果,相比传统的马尔可夫模型提高了2.97%的正确率,预测性能提高了4.16%。实际应用分段马尔可夫模型时,分段数n要根据数据特点选择。

4 结束语

针对部分信道占用度序列具有周期性的特点提出了分段建立马尔可夫模型的频谱预测方法,并给出了周期性信道的筛选方法。在大部分信道占用度都不会稳定在某个值附近的情况下,该方法相较于传统马尔可夫模型可以更好地描述周期性信道中历史数据的变化特点。模型采用的数据分段方法不改变模型阶数,在不改变预测算法复杂度的同时提高了周期性信道的预测精度,并且该方法同样适用于其他以马尔可夫模型为基础的频谱预测模型。使用分段马尔可夫模型时,分段数n要根据数据特点选择,实际应用时可以通过本文类似预实验分析预测正确率相对于分段数n的变化趋势,进而选择合适的n值。

猜你喜欢
马尔可夫周期性分段
慢速抗阻训练:周期性增肌的新刺激模式
新广告商:广告业周期性在弱化,而集中度在提升 精读
面向电力系统的继电保护故障建模研究
基于马尔可夫链共享单车高校投放研究
基于马尔可夫链共享单车高校投放研究
基于马尔科夫算法对预测窗户状态模型的研究
分段计算时间
事业单位财务风险预测建模及分析
一类整数递推数列的周期性
寻求分段函数问题的类型及解法