一种面向物联网的智能反射面通信系统优化方法

2021-05-18 06:19李苗钰杜忠昊刘雨彤牛思莹
西北工业大学学报 2021年2期
关键词:信道联邦权重

李苗钰, 杜忠昊, 刘雨彤, 牛思莹

(西北大学 信息科学与技术学院, 陕西 西安 710127)

第五代移动通信技术(5th-generation,5G)[1]的发展为物联网的规模化部署提供了技术支撑,在物联网时代,海量通信设备的高速无线连接需求与有限的频谱资源之间产生了矛盾[2]。在通信带宽的限制下,从本质上提高通信速率的方法是提高接收端的信噪比(signal-to-noise ratio,SNR)。传统上,提高信噪比的方法有:提高信号的发送功率、中继通信和分集接收等。但是在部署海量物联网设备的场景下,传统的方法已经无法满足高速无线通信的需求。主要原因是物联网设备一般采用电池供电,而且由于设备众多,部署之后不能频繁维护,设备也不能具有太高的复杂度,否则会造成部署和运行成本的急剧上升。因此,物联网设备的功耗和设备复杂度受到严格限制,传统技术手段在物联网设备的应用上遭遇了瓶颈。

事实上,接收端的信噪比是信号发送功率、传输损耗和干扰噪声共同作用的结果。近年来,随着元材料和元表面等相关研究的进一步发展,研究人员开始另辟蹊径,从传输损耗下手,通过改善无线传输环境来提高接收端的信噪比,于是智能反射面(intelligent reflecting surface,IRS)[3]技术应运而生。IRS技术通过软件编程智能地配置集成在平面上的大量无源反射元件,达到改善无线传播环境,提高无线通信系统性能的目的。IRS在形式上类似于中继,但不需要对信号进行处理和二次发送,因此相对于传统的中继具有无时延、低成本、低功耗、易部署等特点。鉴于IRS的大量优点,IRS被广泛应用于各类通信系统中[4-10],IRS辅助的无线通信技术正在成为5G乃至6G的重要技术之一[11]。

在大数据时代,用户隐私泄露问题也日益受到重视,保护用户隐私已经成为通信系统设计过程中不可忽视的要求之一。因此,本文针对物联网和大数据时代海量设备高速无线连接和用户隐私保护的需求,提出了一种基于深度学习和联邦学习的自适应IRS反射系数配置算法,使系统能够依据信道状态信息实时对IRS进行最优配置。该算法还能够依据不同用户对通信质量的差异化需求,智能地进行IRS反射系数的全局配置,实现对高优先级用户的服务质量保障。

1 IRS辅助的无线通信

1.1 IRS的工作原理

IRS的基本工作原理如图1所示,当用户受到障碍物阻挡,无法与基站进行有效通信时,可以通过部署IRS来建立可靠的反射链路,用户接收到的信号由IRS所有反射单元的反射信号所合成。只要IRS中的每个反射单元按特定的角度反射基站的信号,用户接收到的合成信号就能够具有较高的质量。

图1 IRS的基本工作原理

IRS的配置主要有以下2类思路:①首先测量信道状信息,然后从数学上计算出IRS各个反射单元的最优反射角度;②事先设计好IRS的配置码本,通过遍历的方式来查找最优的配置。以文献[12]为代表的第一类方案虽然能实现精确的IRS配置,但随着反射单元数量的增加,运算的复杂度都会提升,而且运算时间的增加导致信道状态信息已经发生较大变化,计算得出的IRS配置与当前真实信道状态信息的匹配度将会下降。而且为了测量每一块IRS反射单元的信道状态信息,需要集成信道感知器件,从而导致设备复杂度和成本的提升。为了解决该问题,第二类方案事先设计好IRS的配置码本,然后通过遍历的方式得到不同信道状态信息下最优的码本,在得到多组信道状态信息和最佳配置码本的数据后,利用深度学习的方式建立信道状态信息和最佳码本之间的映射关系,从而实现给定任意信道状态信息时均能快速配置IRS的目的。

注意到IRS反射单元的距离较近且布局具有规律性,因此相邻反射单元之间的信道状态信息也将接近,文献[13]通过利用相邻反射单元之间信道状态信息的相关性,仅对部分反射单元的信道状态信息进行采样,从而在保证IRS性能的同时,减小获取信道状态信息的成本。进一步地,文献[13]通过遍历码本得到最优的反射系数矩阵,在获取足够的采样信道状态信息与对应的最优反射系数矩阵之后,利用该数据集对多层感知机进行训练,最终建立采样信道状态信息与最优反射系数的映射关系。

1.2 多用户场景下的IRS配置

在如图2所示的多用户场景下,如果需要对IRS进行配置以使得所有用户的信号质量都有提升,则需要对IRS进行全局最优配置。通过采样信道状态信息、遍历码本然后训练深度神经网络的方法,可以实现IRS的全局最优配置。但传统上,该方法需要将用户测量的数据全部反馈给中心服务器,这种中心式机器学习的机制存在3个问题:①大量的本地用户将大规模的数据集传输至中心服务器,对传输带宽的要求极高,无线链路的不稳定性可能会导致数据传输失败;②多个用户传输数据产生的时延不同,时延最大的用户会对系统造成决定性的影响,而且处理更多用户的数据也会带来更高的运算时延;③数据集里的信道状态信息与用户的位置信息具有很高的相关性,因此中心式机器学习所传输的数据可能会带来用户隐私泄露的风险。

图2 服务多用户的IRS

为了解决中心式机器学习所存在的安全隐患,可以采用联邦学习(federated learning,FL)的方式,将用户采集的数据直接在本地进行训练,然后将用户训练得到的神经网络参数在中心服务器上进行聚合[14]。由于用户只传输训练后的神经网络参数,用户的隐私信息得到了保护,同时,神经网络参数传输所需的数据量与原始数据相比微乎其微,网络开销和传输时延得到了有效的降低。

1.3 差异化用户服务质量保障

在传统的联邦学习中,用户本地训练的目标为最大化自己的通信速率,而在中心服务器在聚合时,则直接对所有用户的神经网络参数进行平均,即所有用户具有同等重要性。但在实际场景中,不同用户的服务可能存在不同的紧迫性,因此不同的用户具有不同的服务优先级,网络的全局配置需要优先考虑服务质量要求高的用户。基于上述实际场景需求,本文对联邦学习的聚合算法进行改进,以确保网络的全局优化向优先级高的用户倾斜。加权联邦学习算法的核心思想是:对于通信质量要求较高的用户,中心聚合时提高其参数的权重,从而使系统在更新全局参数时,能够更多地采用高优先级用户的参数,在结果上将表现为把速率更多地分配给优先级较高的用户。

2 IRS辅助通信分析建模

2.1 系统模型

(1)

2.2 信道模型

(2)

(3)

(4)

式中:D和T分别代表循环前缀长度和采样时间;p代表脉冲成型函数;a(θl,φl)代表IRS对第l径的入射波的阵列响应,其中θl和φl分别是第l径入射波与IRS各个单元到达角的方位角和仰角;γl是第l径的路径增益系数;ρ和η分别代表路径损耗和时延。

3 自适应IRS反射系数最优化配置

IRS辅助的多用户无线下行链路通信场景中的速率优化问题可以等效于信道状态信息和IRS的反射系数矩阵的最优匹配问题,因此为了实现IRS辅助无线通信系统中的下行可达速率最大化,需要建立接收机的真实信道状态信息与IRS的最优反射系数矩阵之间的匹配关系,本文将采用码本搜索的方法构建神经网络的输入与输出数据集。

3.1 信道状态信息采样

(5)

(6)

(7)

(8)

(9)

(10)

3.2 最优码本搜索

测量得到采样的级联信道信息作为神经网络的输入之后,需要确定对应的最优输出。根据公式(5)和香农定理[15],接收机k处的可实现通信速率为

(11)

(12)

式中,O为预定义的码本。根据公式(12)在码本中经过遍历搜索得到最优的反射系数向量,则在最优反射系数向量下的最优平均可实现通信速率为

(13)

(14)

3.3 神经网络训练

传统的神经网络训练大量采用中心式机器学习的方式,该方式要求所有的接收机将数据集上传至中心服务器,这不仅会消耗大量的通信资源、导致计算压力集中至中心服务器,而且还将造成训练结果出现较大的延迟。训练结果的延迟由两方面造成,一方面服务器需要等待接收完成所有用户的数据集,另一方面训练数据量的增加也导致训练时间的增长。通过采用联邦学习的训练方式,则能解决上述若干问题。

注意到参与联邦学习的每个用户都采用本地数据集进行训练,而本地数据集则是由该用户的接收机采样得到的信道状态信息所生成的,因此训练结果对于该用户来说是最优的。如果对所有用户的训练结果进行算术平均,则会在物理上对所有用户进行资源分配。考虑到物联网中存在种类繁多的设备,不同的设备有不同的网络质量保障需求,所以需要在平均训练结果时设定不同的权重,从而实现用户资源分配的倾斜。

基于上述讨论,本文使用加权联邦学习的方法训练神经网络,通过建立采样级联信道信息与IRS最优反射系数矩阵之间的映射模型,获取面向IRS辅助的多用户无线下行链路通信场景中的最优速率策略。

在训练之前需要确定神经网络的结构,本文选择多层感知机作为基本的神经网络结构,层数为6,连接方式均为全连接,输入层的维度等于采样级联信道向量的维度,即NM,输出层的维度等于平均可实现通信速率标量的维度,即1。激活函数为修正线性单元(rectified linear unit,ReLU),损失函数为均方误差函数(root mean square error,RMSE),梯度更新规则为随机梯度下降(stochastic gradient descent,SGD),其中接收机k第i次训练的损失函数为

(15)

之后需要开始联邦学习的训练,训练过程主要分为2个部分,即本地训练和中心聚合。所有参与联邦学习的设备根据自己的本地数据集训练出本地模型,然后通过无线链路将本地模型参数上传至中心服务器进行聚合得到全局模型参数,最后将全局模型参数下载至每一个本地设备上作为下一轮本地训练的初始参数,重复以上过程,直至全局模型收敛,最终得到最优的全局模型。

(16)

式中,qk为不同优先级用户对应的权重。最后每个参与训练的设备将Wi+1下载至本地作为下一轮训练的初始参数,重复以上3个过程至全局模型收敛,得到最优的全局模型Wopt。

由于本地用户训练得到的结果为神经网络的模型参数,神经网络模型参数与系统最高速率之间的关系难以直接确定,因此联邦学习权重与最高速率的定量关系也超出了本文的研究范围,本文仅通过仿真实验对权重设置进行定性分析。

4 仿真实验

4.1 仿真场景配置

为了验证本文提出的算法的有效性,本节采用开源的真实世界数据集DeepMIMO[16]进行仿真,DeepMIMO采用射线追踪方法对一条十字形街区内各个地点由位置、建筑环境等因素产生的综合信道响应进行了记录。

本文采用其中的“O1”射线追踪场景来产生仿真信道,仿真场景如图3所示。

图3 仿真场景配置

“O1”场景中的基站7被设置为IRS,发射机的位置在(1 850,90),接收机网格从R2001至R2300,共有54 300个接收点,其中每一行包含181个点。在仿真中,接收机网格划分为5个区域,即U1,U2,…,U5,接收机数量K=5。因此,每个区域内包含的接收点为单个接收机的信道估计次数,即ξ=10 860,其中80%和20%被分别划分为训练集与测试集。

在仿真中,IRS的单元数量为N=576,行数和列数均为24,工作频率为28 GHz,基带为100 MHz的OFDM信道,子载波数量为M=512,但是为了降低神经网络结构的复杂度,只选取前64个子载波来构建本地数据集,即MFL=64。此外,发射机和接收机均配有单个增益为5 dBi的天线。在算法对比设置方面,所对比的传统算法采用的神经网络和本文所提出的加权联邦学习的多层感知机结构保持完全一致。

4.2 仿真结果

依据上述仿真场景配置所获得的仿真结果如图4至8所示。其中图4的结果用于验证算法的收敛性,图5至8的结果用于分析权重设置对不同用户网络性能的影响。

图4 q1=0.6,其余权重均为0.2时的损失函数

从图4中可以看出,加权联邦学习的损失函数略大于等权联邦学习,原因是加权联邦学习使得优先级较低的用户分配到的速率比等权联邦学习更低,因此训练得到的配置与本地最优配置有更大的差异,最终导致损失函数增大。由于多用户场景下无法保证IRS的反射系数配置对于所有用户都是最优的,因此一般情况下损失函数都将大于零。此外,随着迭代次数的增加,损失函数将维持在一个恒定的值附近,说明训练结果达到收敛。

图5比较了加权联邦学习和等权联邦学习下用户U1和用户U5可达速率,其中用户U1具有更高的权值(优先级)。显然,在加权联邦学习下,用户U1可以达到更高的传输速率,仿真结果证明了加权联邦学习可以使系统分配更多的速率给优先级较高的用户,从而有效保障高优先级用户的服务质量。

与图5相比,图6中除用户U1之外的所有用户均提高了权重,因此可以看到系统减少了对用户U1的速率分配,而用户U5的可达速率则有一定的提升。

图5 q1=0.6,其余权重均为0.2时 图6 q1=0.6,其余权重均为0.4时 图7 q1=0.8,其余权重均为0.4时的可达速率 的可达速率 的可达速率

从图6到图7,用户U1的权重从0.6提高到0.8,从而导致其他用户的可达速率有所下降,以此为代价,用户U1的可达速率则有所增加。此外,通过比较图5和图7的结果,可以发现在2个场景中,用户U1的权重均比其他用户高出0.4,然而图7中用户U1的可达速率低于图5中的速率。注意到图5中用户U1权重为其他用户权重的3倍,而图7中为2倍,因此说明用户权重配置的比例关系比权重的绝对差值更能影响系统对可达速率的分配。

图8 q1=q2=0.8,其余权重均为0.4时的可达速率

图8则将用户U1和用户U2的权重均设置为0.8,通过与图7对比,可以发现用户U1和用户U5的可达速率均有所下降,因为用户U2权重的提高导致系统将用户U1和用户U5的部分资源分配给了用户U2。

图5至8的仿真结果有效地证明了加权联邦学习具有对高优先级用户服务质量保障的能力,同时还说明了权重配置变化对用户可达速率的影响,即:提高某个用户的权重,将牺牲其他用户的部分资源来提升该用户的可达速率,反之亦然。

5 结 论

本文基于物联网时代海量设备对高速无线通信和用户隐私保护的需求,提出了一种基于深度学习和加权联邦学习的IRS反射系数自适应配置算法。该算法首先利用部分具有信道测量功能的反射单元进行信道状态信息采样,然后通过遍历码本的方式查找最优IRS反射系数矩阵,并将采样信道状态信息和最优IRS反射系数矩阵的组合纳入训练数据集里。之后每个接收设备利用训练数据集对神经网络进行本地训练,建立采样信道状态信息和最优IRS反射系数矩阵的映射关系,再将训练后的神经网络参数上传到中心服务器。中心服务器根据每个用户对通信质量的需求程度来确定用户的优先级,在对神经网络参数进行聚合时,高优先级用户的神经网络参数会具有更高的权重。最后,本文利用真实世界测量的数据集进行了仿真实验,仿真结果验证了本文所提出的加权联邦学习算法能够保障高优先级用户的服务质量。

猜你喜欢
信道联邦权重
基于自适应学习的5G通信系统信道估计方法
权重望寡:如何化解低地位领导的补偿性辱虐管理行为?*
性能全面升级 音联邦举办CANTON、SVSound新品发布会
信号/数据处理数字信道接收机中同时双信道选择与处理方法
典型办公区域Wi-Fi性能的优化
一“炮”而红 音联邦SVSound 2000 Pro品鉴会完满举行
权重常思“浮名轻”
为党督政勤履职 代民行权重担当
权重涨个股跌 持有白马蓝筹
集中式无线局域网信道分配算法