曾孝平,樊雯雁,陈 礼
(重庆大学通信工程学院,重庆 400030)
目前,飞机跨洋飞行主要依靠天基网[1],但由于卫星通信成本太高、传播时延大,不能满足航空通信低时延的要求,所以,在跨洋航空网络中利用飞机主干网络作为信息传输的载体,通过对主干网络的频谱配置,实现飞机与地面基站的通信[1]。主干网络的频谱资源有限,有效地对主干网络上的频谱资源进行分配是一个急需解决的问题。
认知无线电的频谱共享技术可以有效地解决频谱资源分配的问题。基于博弈论的频谱共享方法是研究的热点。文献[2]提出频谱接入问题是一个非合作的博弈过程,用学习效率分配算法可以获得相关的均衡;文献[3]用讨价还价的方法来实现频谱分配;文献[4]提出频谱分配可以作为重复博弈来研究;文献[5]分析了主用户收益最大时次级用户的博弈模型,却没有证明该模型下纳什均衡的公平性;文献[6]提出了单个主用户对多个次用户的频谱共享模型,但该模型只探讨了次级用户收益最大时的频谱分配,忽略了主用户的效用。
本文提出了一种跨洋航空网络的频谱共享博弈模型,可以有效地对主干网络上有限的频谱资源进行分配。在文献[6]的基础上,本文采用Cournot博弈的频谱共享模型,综合考虑了主用户与所有次级用户的收益,主用户制定最佳单位带宽定价保证自身收益最大,各次级用户根据最佳单位定价改变请求带宽以获得最大收益,通过与次级用户收益的最优化模型进行比较,验证了该模型的纳什均衡具有公平性,能很好地解决跨洋航空网络的频谱分配问题。
飞机跨洋飞行在大西洋上空,与地面基站的通信主要是利用主干网络的频谱资源来实现。跨洋航空网络的频谱分配可看作认知无线电频谱共享系统,由单个主用户和N个次级用户组成,如图1所示。
图1 系统模型图Fig 1 System model
主用户是主干网中的所有飞机,将其视为一个整体,并能直接和地面网关通信。主用户愿意分配部分可用的空闲频谱bi给次级用户i,主用户向次级用户索要每单位最佳带宽定价P,P与分配给次级用户总带宽大小有关。次级用户访问主干网,通过频谱侦听技术监测主用户的空闲频谱,如果次级用户接受主用户的最佳单位带宽定价P,则使用自适应的调制技术在共享的频谱上进行通信,完成与地面的通信。其数学模型在下面的章节中进行分析。
静态博弈模型中,所有的次级用户能完全观察到其他用户的策略和收益,是一个集中式的理想频谱共享场景。为保证主用户收益最大,主系统采用最佳的单位带宽定价P,则次级用户的效用函数为
其中,ri为每单位传输速率获得的收益,bi为次级用户i请求的带宽,P为主用户的最佳单位带宽定价,ki为无线传输信道的频谱利用率,即rikibi为次级用户的收入,biP为租用频谱的花费。
根据文献[5]和文献[7],P,k可分别表示为其中,w,m,τ均为常数,w为主用户每单位服务质量损失,B为次级用户租借的总的频谱大小
将式(2)带入式(1)中,得到次级用户i的效用函数为
由博弈论知识可知,纳什均衡可以由最佳反应函数得到。次级用户i的反应函数为
在动态博弈中,次级用户只知道主用户的定价信息,不知道其他用户的策略和收益。因此,可以基于每个次级用户与主用户的相互作用,得到每个次级用户的纳什均衡。根据临界收益函数,为了最大化收益,次级用户调整所需带宽bi的大小。所需分配频谱大小的调整就可看成是一个动态的博弈
式中bi(t)为次级用户i叠代t次时分配频谱的大小,αi为次级用户i的调整速度参数,Q(·)为自身映像函数。通过雅可比矩阵,分析次级用户分配的频谱的稳定区间,由上式(6)可得
将上式(7)带入雅可比矩阵J
可求得该博弈模型的纳什均衡的不动点,令雅可比矩阵J的所有特征值|λi|<1,得到各αi的相互关系,从而得到该动态博弈的稳定区间,该稳定区间可用于分析动态博弈的收敛性。
为了研究纳什均衡的公平性,提出次级用户收益的最优化模型[8]。次级用户的最优化问题可以表述为
采用全局最优化技术,得到所有次级用户的边缘利润函数,由式(1)估计边缘利润的值,由文献[8]得
比较该方程的最优化解B={b1,b2,…bN}和纳什均衡的解B*={,…},可以验证纳什均衡的公平性。
本节分析了航空自组网频谱共享博弈模型的纳什均衡、动态博弈收敛结果,验证了纳什均衡的公平性。参数设置:航空自组网系统中有1个主用户和2个次级用户,主用户和次级用户共享的总带宽为20MHz,ri=10dB,w=2,τ=0.5,初始策略bi(0)=2。
图2表示不同的信道质量下,2个次级用户的最佳请求带宽与纳什均衡点。从图中可以发现:1)当只有2个次级用户时,纳什均衡点位于2个次级用户反应函数的交点;2)纳什均衡点的位置取决于信道的质量,信道信噪比越大,纳什均衡点上移,次级用户分得更多的频谱。该结果可推广至多个次级用户的情况,纳什均衡点将是所有最佳反应函数的交点。
图2 最佳请求带宽与纳什均衡Fig 2 The best requested bandwidth and Nash equilibrium
设动态博弈初始策略,bi(0)=2,次级用户请求带宽变化如图3所示。从图中可以得到:1)当γ1=15dB,γ2=15dB,动态博弈稳定时,次级用户1和次级用户2请求的带宽分别收敛到大约为7.8MHz和5MHz。当γ1=10dB,γ2=11dB,动态博弈稳定时,次级用户1和次级用户2请求的带宽分别收敛到大约为3MHz和4MHz。2)信道质量越好,信噪比越大,请求的带宽数量越多。3)对于该不完全信息动态博弈,次级用户请求带宽的收敛速度取决于学习速率α。对次级用户1,αi=0.4时,请求带宽的收敛速度大于αi=0.7时的收敛速度,因此,学习速率αi越大,收敛得越慢。
图3 动态平衡的收敛性Fig 3 The convergence of dynamic equilibrium
为了验证纳什均衡解决频谱共享具有公平性,将其与最优化模型进行比较,其结果如图4所示。从图中可以得到:1)在最优化模型收敛到稳定状态时,当r1=15dB,r2=14dB,只有次级用户1分享到频谱b1=9.6MHz;当r1=10dB,r2=11dB,只有次级用户2分享到频谱b2=7.5MHz。2)在竞争式模型收敛到纳什均衡时,当r1=15dB,r2=14dB,(,)≈(7.8,5);当r1=10dB,r2=11dB,(,)≈(3,4)。3)最优化模型收敛到稳定状态时,只有信道质量好的一个次级用户能分享到频谱,其它次级用户没有分享到频谱。而在竞争式模型纳什均衡收敛点处各次级用户都能共享到频谱,两次级用户收敛点处的请求带宽乘积最大,所以,纳什均衡为竞争式频谱共享问题提供了公平的方法,适用于跨洋航空网络中主干网络的频谱共享问题。
图4 最优化和竞争式模型中次级用户收敛轨迹Fig 4 Optimization and competitive convergence trajectory of secondary users
本文提出了一种跨洋航空网络中主干网络的频谱共享Cournot博弈模型,该模型综合考虑了主用户和所有次级用户的收益,主用户选择最佳单位带宽定价保证自身收益达到最大,各次级用户根据主用户的最佳单位定价改变请求带宽以获得最大收益。该博弈模型的静态博弈与动态博弈的仿真结果和纳什均衡的公平性验证,说明了用该模型解决跨洋航空网络中主干网络的频谱分配问题是一种行之有效的途径。
[1]Sakhaee E,Jamalipour A.The global in-flight internet[J].IEEE Journal on Selected Areas in Communications,2006,24(9):1748-1757.
[2]Han Z,Pandana C,Liu K J R.Distributive opportunistic spectrum access for cognitive radio using correlated equilibrium and no-regret learning[J].IEEE WCNC,2007,132(29):11-15.
[3]Cao L,Zheng H.Distributed spectrum allocation via local bargaining[C]//IEEE SECON,2005:475 -486.
[4]Etkin R,Parekh A,Tse D.Spectrum sharing for unlicensed bands[J].IEEE J Sel Areas Commun,2007,25(3):517 -528.
[5]黄丽亚,刘 臣,王锁萍.改进的认知无线电频谱共享博弈模型[J].通信学报,2010,31(2):136 -138.
[6]Niyato D,Hossain E.Competitive spectrum sharing in cognitive radio networks:A dynamic game approach[J].IEEE Transactions on Wireless Communications,2008,7(7):2651 -2660.
[7]邱锦波.自适应无线视频传输方法[D].武汉:华中科技大学,2006.
[8]Niyato D,Hossain E.Competitive pricing for spectrum sharing in cognitive radio networks:Dynamic game,inefficiency of Nash equilibrium and collision[J].IEEE Journal on Selected Areas in Communications,2008,26(1):192 -202.