基于迁移学习的室内波束选择优化方法

2024-03-05 10:22王俊智仲伟志肖丽君朱秋明林志鹏
系统工程与电子技术 2024年3期
关键词:波束接收机信道

王俊智, 仲伟志, 肖丽君, 王 鑫, 朱秋明, 林志鹏

(1. 南京航空航天大学航天学院, 江苏 南京 210016; 2. 南京航空航天大学电子信息工程学院, 江苏 南京 210016)

0 引 言

毫米波频段具有巨大且连续的未分配带宽,可以满足无线通信系统对更高数据速率的要求。因此,毫米波通信获得了人们的广泛关注[1]。

由于毫米波传输具有路径损耗和遮挡问题[2],因此需要采用大规模阵列天线波束形成技术,产生高增益的定向窄波束以弥补路径传输损耗[3]。毫米波的高频特性决定了其较适合室内或室外的短距离传输,但是实际应用中发射端和接收端的相对运动会导致波束搜索复杂度高、波束对齐困难等问题,尤其当室内或者室外小区内存在丰富障碍物时,用户与基站之间的波束选择难度将进一步增加,波束匹配过程也将消耗大量的运算时间和数据资源[4]。针对这一难点,国内外研究者做了大量的研究工作。经典的波束搜索算法为穷举搜索方法[5],即对码本中所有的波束对逐个搜索以找到最佳波束对,但该方法的搜索时间较长,难以适用于室内目标随机移动这一场景。为了减少搜索时间,研究者提出一种分层搜索[6-7]方法,但当主信道路径的预波束成形信噪比较低时,分层搜索精度会降低。文献[8]从亚6 GHz获得带外信息,用于毫米波波束搜索以解决上述问题,但先验信息需要通过收发器上的传感器或者进行额外测量来获得,这就导致了额外的系统开销。文献[9]提出一种逆指纹方法,该方法利用多路径指纹和位置信息,在非视线路径(non-line-of-sight, NLOS)的情况下扩展了基于先验信息的波束选择方法。文献[10]提出一种基于匈牙利算法的波束选择方案,通过将波束选择建模为二部图上的最大权匹配进行波束选择,此算法的计算性能虽好,但复杂度较高。文献[11]提出一种基于临近波束的波束搜索算法,该方法可以有效地减少波束搜索次数,降低波束搜索时延,在移动场景中具有更高的搜索效率。

此外,由于机器学习在处理非线性问题中具有较好的性能表现,因此学者们提出将机器学习应用于波束选择。文献[12]证明了信道预测最佳毫米波波束的过程存在非线性函数关系,并且证明了一个足够大的神经网络可以预测最佳毫米波波束和阻塞状态,其成功概率可以无限接近1。文献[13]提出一种基于三维(three-dimensional, 3D)场景的波束选择方法,该方法主要贡献为使用摄像机离线拍摄场景图像进行3D场景重建,并将其场景点云作为输入来构建神经网络,显著降低了运算复杂度,且适用于小型移动终端。文献[14]引入基于深度学习的图像重建方法提高波束形成效率,该方法能够有效降低波束选择的开销。文献[15]提出一种基于深度神经网络(deep neural networks, DNN)的波束选择方法,该方法利用接收机的位置和方向来推荐最佳波束对的列表,从而显著地减少了搜索开销。然而,基于神经网络的方法需要大的训练数据集来优化其网络中的所有可训练参数。训练数据集特定于每个部署站点及其传播环境,以及基站和用户使用的天线阵列配置。由于数据集收集的时间和成本较大,因此大型训练数据集的构建是采用神经网络进行波束选择需要面临的一个主要难点。针对上述问题,迁移学习(transfer learning, TL)技术[16]得到了广泛应用,该技术可将先前用大数据集训练的网络中的部分信息转移到仅有小训练数据集可供使用的另一网络。文献[17]提出一种带有TL的并行DNN来预测用户多链路的最佳波束,并表明并行TL结构可以有助于减少干扰和训练开销。文献[18]为了有效利用经验样本,使用了迁移强化学习来解决毫米波网络中的干扰缓解问题,从而加快了任务的收敛。

基于TL技术具有能够节约数据集收集时间和成本的优点,本文提出一种基于TL的室内波束选择优化方法。该方法使用小数据集来优化神经网络参数,可以从用大数据集训练的网络中传输有用的信息。当无法在任意环境和任意可能的配置下测量大量样本时,本文提出的优化方法能够有效地进行波束选择。

1 系统模型

本文采用二维(two-dimensional, 2D)室内几何信道模型[19]。如图1所示,在该模型中,发射机和接收机均配备均匀线性阵列(uniform linear arrays, ULA)天线。假设天线均水平放置,分别由Nt和Nr个阵元组成,阵元间隔为半波长,即d=λ/2。接收机随机放置在位置pr=(xr,yr)的定义区域内,其方向为αr∈[0,2π)。

图1 室内2D几何信道模型Fig.1 Indoor 2D geometric channel model

发射机和接收机之间的信道由一条视线路径(line-of-sight, LOS)路径和L条NLOS构成,因此接收机在某一位置、某一时刻的信道矩阵可建模为

(1)

(2)

(3)

本文采用模拟波束赋形系统,分别用F=[f1,f2,…,fNt]和W=[w1,w2,…,wNr]表示发射机的波束赋形码本和接收机的波束结合码本,为了简单起见,设定每个码本分别具有Nt和Nr个码字。本文采用常见的基于离散傅里叶变换(discrete Fourier transform, DFT)的码本[15]。因此,波束赋形向量和波束结合向量可分别表示为

(4)

(5)

式中:p∈{1,2,…,Nt},q∈{1,2,…,Nr}。在每个时隙上,根据预编码器fp∈F和组合器wq∈W,接收信号功率R∈RNt×Nr可以表示为

(6)

2 基于TL的波束选择

利用环境中的先验信息有助于提高波束选择的精度[12-15],同时减少匹配过程的延迟。先验信息可在训练阶段从测试环境中感知提取。由于利用信道先验信息预测最佳波束对的过程存在非线性函数关系,且神经网络具有较强的学习非线性函数的能力。因此,可采用DNN来解决此类问题。但是,DNN需要采用大数据集来调整其参数,但在每个环境中捕获大量样本会导致成本大幅度增加。TL是一种将大数据集场景的知识转移到小数据集场景中使用的技术,可以解决因为数据集过小而导致神经网络无法得到充分训练这一问题。因此,本文将采用TL对小数据集情况下基于深度神经网络的波束选择进行优化。具体优化步骤如算法1所示,后续将对每一步进行详细介绍。

算法 1 基于TL的波束选择优化方法参数设定:设场景A对应网络为DNNA,数据集为DA;设场景B对应网络为DNNB,数据集为DB;其中DA为大型数据集,DB为小型数据集,并且DNNA和DNNB网络层数和隐藏层神经元个数都相等。1: 随机初始化DNNA的权重 2: 使用DA对DNNA进行训练3: 对目标环境特征和用户配置进行判断情况 1: B场景与A场景用户配置相同,环境改变4-1: 使用训练后的DNNA的隐藏层和输出层权重初始化DNNB的隐藏层和输出层权重,冻结DNNB的输出层权重使其不被训练,仅使用DB对其隐藏层权重进行训练。情况 2: B场景与A场景用户配置改变,为同一环境4-2: 使用训练后的DNNA的隐藏层权重初始化DNNB的隐藏层权重,DNNB的输出层权重随机初始化,冻结DNNB的隐藏层权重使其不被训练,使用DB仅对其输出层权重进行训练。5: DNNB训练完成。

2.1 网络结构

由于TL是对神经网络的权重进行迁移,因此,在本文中为了简化模型,假设源域跟目标域使用的神经网络层数和神经元个数相同,该DNN参考结构如图2所示[15]。

图2 网络结构Fig.2 Network structure

该神经网络根据接收机的坐标和方向来预测每个波束对产生最大接收信号强度(received signal strength, RSS)的概率。其中,输入是接收机的位置(xr,yr)及其方向αr,每个输出对应于一个唯一的波束对,因此共有NtNr个输出。该网络的隐藏层和输出层分别使用tanh及Softmax函数作为非线性激活函数。如图2所示,DNN的输出O={oi,j|i=1,2,…,Nt;j=1,2,…,Nr}是关于输入的非线性函数,如

(7)

2.2 数据集的生成

为了生成具有M个用户点的环境训练数据集,本文采用式(6)计算设定场景中与每个用户位置和方向相对应的各个波束对的RSS,获得大小为M的数据集,该数据集可以表示为D,每组数据中包含的信息有:神经网络输入的向量(xr,yr,αr)和第m={1,2,…,M}个用户相对应的各个波束对的RSS。对于给定的位置和方向,神经网络可以学习RSS最高的波束对。

2.3 TL

TL旨在通过转移不同但相关的源域中包含的知识,提高目标学习者在目标域的表现。通过这种方式,可以减少构建目标学习者对大量目标域数据的依赖。研究表明,TL具有多样性,既可以跨领域也可以跨任务应用,其目标是分别在不同环境或不同任务之间转移知识[16]。本文分别对跨领域和任务的两种情况与所考虑场景进行结合,提出以下两种方案。

2.3.1 域自适应

假设在一个环境中有一个大的测量数据集DA,将此环境称为源域,假设在另一个环境中只有有限大小的数据集DB可供使用,将该环境称为目标域,两种环境中的发射机和接收机分别有Nt和Nr个阵元。将源域中使用的深度神经网络定义为DNNA,该网络有Nh个隐藏层,每个隐藏层有n个神经元。由于该环境有大数据集DA可供使用,因此DNNA的权重可以用随机值初始化,并通过标准反向传播算法进行训练。如果在目标域中使用一个与DNNA具有相同网络层数和神经元的DNNB,则可以使用DNNA的训练权重W初始化DNNB,将源域中学习的信息传输到目标域,其中网络的隐藏层可以理解为包含环境等先验信息,输出层可以理解为包含用户配置信息[12]。因为域自适应中环境不同,用户配置相同,因此隐藏层的映射需要更新,输出层的映射可以保留。故在仿真中可以冻结输出层权重,仅使用DB训练隐藏层权重,冻结这些层减少了网络中可训练参数的数量,这极大提高了使用小数据集训练时的性能。

2.3.2 任务自适应

3 仿真验证

由于TL技术是对基于深度学习(deep learning, DL)的波束选择方法的优化,故本节将对基于TL的波束选择与基于DL的无TL波束选择方法进行比较。为了评估域自适应案例中的TL思想,设定两种不同的2D室内场景,一个为空阔房间(empty room, ER),一个为普通室内房间(ordinary indoor room, OR)。

ER表示一个没有任何障碍物的室内环境,其大小为60 m×60 m。OR场景如图3所示,设定该室内场景中有6个静态物体,包括4个墙壁和2个固定障碍物,动态物体的数量λ可作调整[15]。用于信道建模的参数如表1所示。

图3 OR场景Fig.3 OR scenario

表1 信道模型参数Table 1 Channel model parameters

仿真所用到的两种室内场景模型发射机均放置在距离左墙1 m处,室内的接收器放置在任意位置。

在每个波束对的选择过程中,根据2D齐次泊松点过程在房间内绘制新的移动对象,而静态对象在所有环境实现中始终保持相同的位置和方向。设定移动物体映射到2D平面的大小为0.35 m×0.6 m,以模拟室内的行人,接收机随机放置在房间内,与静态物体和移动物体没有重叠。在这种情况下,由于房间内有两个尺寸为6 m×1 m的固定障碍物和其他移动物体,因此部分或所有路径可能会被阻塞。

高阶反射路径是指那些经过物体多次反射后才能到达接收机路径。根据成像理论,反射物体越大,反射路径从给定物体到达接收机的概率越大[19]。由于在OR场景中,移动对象比静态对象小得多,因此,除了信号能量较小的高阶路径之外,有的反射路径经过多个移动对象到达接收机的概率接近于零。鉴于此,在生成数据集的过程中可以忽略来自多个移动对象的反射路径,以减少射线跟踪过程的计算时间。

仿真中,每个接收机的位置处均使用100条最强路径来构造信道响应。通过计算每个用户位置处每个波束对的RSS来生成数据集,并将该数据集随机分成两组:第一组包含80%的数据,用于训练;另一组包含其余20%的数据,用于评估迁移学习的性能。ER和OR中培训样本分别是100 000和50 000。设定用于训练的神经网络有5个隐藏层,每个层有128个神经元,为了防止过拟合,每个隐藏层设定10%的节点丢失率。使用具有50个epoch的Adam优化器来训练神经网络,训练样本从32个逐渐增加到8 192个。此外,将每个波束对的标签转换成一个向量,用来计算损失函数。仿真中将使用以下4种方法进行评估。

(1) DNN:具有随机权重初始化并在目标数据集上进行训练的DNN方法。

(2) DNN-TL:使用源权重初始化,并使用目标数据集对所有层进行微调的DNN方法。

(3) 域自适应DNN-TL(DNN-TL-domain adaptation, DNN-TL-DA):使用源权重初始化,输出层被冻结,隐藏层使用目标数据集进行优化,即域自适应。

(4) 任务自适应DNN-TL(DNN-TL-task adaptation, DNN-TL-TA)。使用源权重初始化,隐藏层被冻结,隐藏层使用目标数据集进行优化,即任务自适应。

其中,方法(1)为基于DL的无TL波束选择方法,方法(2)~方法(4)为3种不同的基于TL的波束选择方法。

为了评估TL技术在域自适应场景中的效果,设定源场景和目标场景中TX和RX天线单元个数均为64个。使用100 000数据集DA将ER中的网络DNNA作为源域进行训练。为了在目标域OR中微调DNNB,分别使用10 000数据集和50 000数据集DB评估目标数据集对TL性能的影响。

在本文中,使用失配概率来评测这几种方法的性能,其定义为不包含接收功率最高的波束对的最小概率,其表达式为

(8)

式中:B表示所有可能的波束对的集合;Sk表示排名前Nb的波束对。

图4和图5分别展示了处理OR中不同数据集时不同波束选择方法的失配概率。当采用较少数据集训练时,使用TL技术可以显著改善波束选择性能,并且数据集越小,效果越好。这是因为通过使用528 384个参数冻结输出层,可训练参数的数量从594 944减少到了66 560个。冻结约88%的权重有助于网络更好地工作,尤其是在目标域中训练样本很少的情况下。

图4 数据集10 000的域自适应Fig.4 Domain adaptation of dataset 10 000

图5 数据集50 000的域自适应Fig.5 Domain adaptation of dataset 50 000

图6和图7展示了不同波束选择方法可实现的频谱效率。通过假设一个固定的信道相干时间,从系统的可实现速率中减去每个相干时间段用于波束选择的信道资源比例即可得到。因此,有效频谱效率可以定义为

(9)

式中:Ts和Tfr分别表示在波束选择过程中扫描波束对所需的时间和固定信道响应的一帧持续时间[14]。SNRp,q是波束对准之后与选定波束对(p,q)相对应的信噪比,其定义为

(10)

图6 域自适应的频谱效率(数据集10 000)Fig.6 Spectrum efficiency of domain adaptation (dataset 10 000)

图7 域自适应的频谱效率(数据集50 000)Fig.7 Spectrum efficiency of domain adaptation (dataset 50 000)

在仿真中,设定Tfr=20 ms,Ts=0.1 ms,可以通过改变候选波束列表大小来调整Nb。通过使用TL和冻结输出层,在扫描波束对数相同的情况下,基于TL的方法获得的频谱效率明显优于DNN方法,并且数据集越小,频谱效率提高越明显。

TL在任务自适应问题中的优越性如图8和图9所示,其中任务是指在同一环境中使用不同天线配置进行波束选择。

图8 数据集10 000的任务自适应Fig.8 Task adaptation of dataset 10 000

图9 数据集50 000的任务自适应Fig.9 Task adaptation of dataset 50 000

在环境OR中,使用分别具有64个和16个天线阵元的TX和RX来捕获大型数据集DA。在相同的环境中,收集一个小型数据集DB,其中TX和RX均有64个天线阵元。如图8和图9所示,TL在小数据集下,通过冻结隐藏层,能够有效的改善失配概率。

4 结 论

在室内毫米波通信中,可以使用DNN方法,充分学习环境信息,来实现波束选择,但有限的数据集使DNN不能高效地进行波束精确匹配。基于此,本文利用TL技术对深度机器学习进行优化,其中引入参数重用方法,可以显著降低执行基于位置和方向的波束选择的神经网络对于大训练数据集的依赖。此外,在目标环境或者目标天线配置中使用小数据集对不同层的网络参数进行微调,可使经过训练的神经网络权重在其他传播环境或目标天线设置中有效重用。仿真结果表明,本文提出的基于TL的室内波束选择优化方法能够有效提高有限数据集下的神经网络训练效果。

猜你喜欢
波束接收机信道
毫米波大规模阵列天线波束扫描研究*
一种用于调幅接收机AGC的设计与实现
一种面向ADS-B的RNSS/RDSS双模接收机设计
圆阵多波束测角探究
Helix阵匹配场三维波束形成
数字接收机故障维修与维护
基于多接收机的圆周SAR欺骗干扰方法
基于导频的OFDM信道估计技术
一种改进的基于DFT-MMSE的信道估计方法
基于非正交变换的局域波束空时自适应处理