基于数据驱动的大气压射频放电等离子体数值模拟研究1)

2024-01-04 01:24王绪成李文凯刘志兵张远涛

力学学报 2023年12期

王绪成李文凯艾飞刘志兵张远涛

(山东大学电气工程学院,济南 250014)

引言

近年来,大气压非平衡等离子体的研究得到人们广泛的关注[1-4],特别是大气压下的容性耦合射频放电由于其结构相对简单,耦合功率密度高,能产生大体积均匀等离子体等优势,成为了目前国际上放电等离子体领域的热点研究之一[5-7].一直以来,射频放电等离子体在等离子体刻蚀、镀膜和生物医学等方面得到了广泛的应用[8-10].大量的实验和计算研究表明大气射频放电可以工作在不同的放电模式下,即α 模式和γ 模式[11-13].在α 模式下,大气压射频放电可以产生均匀的大体积等离子体,但当输入功率增加时,这种均匀的等离子体很容易出现气体加热效应,并呈现径向集聚,导致射频放电从α 模式过渡到γ 模式[14-15].因此需要深入研究抑制大气压射频放电模式转换的方法,一般说来降低放电间隙至微等离子体尺度与提高放电频率至甚高频范围是常用的抑制手段,引入脉冲调制也是近年发展起来的有效方法[16-17].

数值模拟作为揭示放电等离子体物理特性的一种有效方法,已被证明是探究大气压射频放电中各种物理和化学特性的有效工具,目前常用的等离子体数值模拟方法包括粒子(PIC-MCC)模拟与流体模拟[18-19].粒子模型在整个模拟过程中追踪了放电空间内所有的宏粒子位置与速度的变化以及电场的变化,可以详尽地描述等离子体放电过程中的动理学特征.流体模型通过数值求解带电粒子的连续性方程、动量方程和能量方程,并耦合泊松方程对放电的发展进行模拟.但是在大气压下,当放电空间尺度非常小(比如微等离子体),时间尺度变化非常快(比如ns 脉冲放电)时,流体模拟无法准确地描述等离子体的动理学特性.但是粒子模拟对于大气压高密度等离子体以及密度范围变化较大的放电过程的计算耗时极大.总的来说,流体模型并不适于微间隙条件下的等离子体建模研究,而粒子模型则在苛刻的时间步长与空间步长条件限制下需要极大的计算耗时[19],因此引入一种新的计算模式来提高数值模拟的效率与效果是非常必要的.

近年来,由于等离子体研究和应用领域中数据科学和技术的进步,数据驱动的等离子体科学和技术正在迅速发展[20].数据驱动的科学被称为发现的第四范式,数据驱动的发展使通过人工智能实现完全自动化的科学发现成为可能[21].在数据驱动技术中,人工神经网络已经成为实现具有非线性特征的输入-输出映射系统建模的强大手段[22-25].人工神经网络学习复杂映射的固有能力,以及相对容易训练的特性,可能使其非常适合基于非线性模型的等离子体建模工作.此外,神经网络可以从训练数据中学习等离子体系统的性质,进而给出反映等离子体特性的数据,实现从输入数据到输出数据的映射,而无需事先了解等离子体性质背后的物理方程[26].

一般来说,人工神经网络由输入层、隐藏层和输出层组成,当隐藏层的个数超过两个时,可以将该神经网络称为深度神经网络(deep neural network,DNN).目前,DNN 已成功地被应用于各种等离子体过程.我们曾基于机器学习方法构造了一个DNN 来探究大气压介质阻挡放电的电流电压特性、电场强度和带电粒子密度等宏观与微观放电特性[27],该研究表明DNN 是研究大气压等离子体特性的有力工具.Pan 等[28]将DNN 引入到等离子体催化动力学建模中,他们使用DNN 代替动力学模拟,有效地预测了不同约化场下目标产物的密度.此外,Nazari 等[29]开发了一个神经网络来评估介质阻挡放电反应器中CO2的转化率和能源效率.计算结果表明,神经网络在评估等离子体辅助CO2转化性能方面具有极大的潜力.可以这样讲,基于数据驱动技术的DNN 算法不仅可以自动提取训练数据的特征,而且在满足精度要求的前提下具有很高的计算效率,这为低温等离子体数值模拟提供了一种很有潜力的方法.

因此,本研究以DNN 在大气压射频放电中的计算为例,讨论数据驱动方法在低温等离子体模拟中的应用.相较于我们之前研究的大气压介质阻挡放电[27],大气压射频放电由于放电频率较高,带电粒子一般被束缚在放电空间内,所以放电电流及带电粒子密度在一个周期内变化比较平缓.在本研究中,我们基于数据的特点,构建了一个具有多层隐藏层的通用DNN 结构,并利用该DNN 模型代替流体模型和粒子模型,实现对于大气压射频放电等离子体的各种动理学特征的准确高效计算.

本文的主要内容如下: 第1 节简单描述了用于提供训练数据的流体模型和粒子模型,并构造了一个适用于预测大气压射频放电特性的通用型DNN算法;在第2 节中通过将DNN 模型的预测结果与传统的流体模型及粒子模型的计算结果进行比较,证明了DNN 模型的高效性和准确性,同时使用该DNN 模型对大气压射频等离子体的各种特性进行了高效的分析研究;最后,第3 节给出了本工作的总结和展望.

1.1.1 流体模型

在大气压下,带电粒子的平均自由程非常短,粒子之间的碰撞也非常频繁.在射频放电的研究中,流体模型通常用连续方程和扩散漂移近似方程来描述各种粒子的产生、消失与输运,使用泊松方程计算放电空间中的电场强度,基于麦克斯韦分布的假设,通过求解电子能量平衡方程来获得电子温度.因此,描述大气压射频放电的主要控制方程如下[30-31]

1 计算方法描述

1.1 物理模型

式中,下标i表示粒子i,N,Γ和S分别表示粒子数密度、粒子通量和粒子源项,μ和D分别为粒子迁移率和扩散系数.qi表示粒子i的电荷量(例如电子的电荷量为-1).ε0和E分别为真空介电常数和电场.,e,me,mg,kel,kB,Te和Tg分别表示电子平均能量、基本电荷、电子质量、背景气体分子质量、背景分子与电子之量间的动量传递频率、玻尔兹曼常数、电子温度和气体温度.具体的流体模拟方法的示意图如图1 所示.只是需要注意的是,大气压下极其频繁的粒子碰撞严重限制了流体模拟中空间网格和时间步长的选择.

图1 流体模拟方法Fig.1 Scheme of the fluid simulation

1.1.2 粒子模型

对于大气压射频放电,特别是在微间隙中,电子能量分布函数(EEDF)并不一定满足Maxwell 分布,另外在大气压射频放电从α 模式转化到γ 模式过程中,等离子体的动理学行为有时也较为显著,这样,粒子模拟就成为必需的数值模拟方法.

在粒子模型中,为了避免数值不稳定导致的模拟发散,必须选择合理的时间步长和空间步长,即Δx≤λD,ωpΔt≤2 和Δx/Δt≤vt,其中λD是等离子体德拜长度,ωp是等离子体振荡频率,vt是电子热速度[32].在粒子模拟的过程中为了保证准确地计算粒子运动轨迹,要求运动方程的积分时间步长必须足够小,需要成百数千个的粒子网格,而时间步长往往被限制在10-14～ 10-12s 之间.另一方面,空间分辨率的选择是准确描述等离子体动理学特征的关键,每个网格内需要超过100 个宏粒子以消除蒙特卡罗过程的随机误差[33].在粒子模拟的具体实现中,隐式格式可以在保持计算精度的同时尽可能地允许更大的时间步长和空间步长,从而可以大幅提升计算效率[34].一般说来,粒子模拟循环过程如下: (1)计算带电粒子密度;(2)计算电势和电场;(3)计算作用在粒子上的力;(4)推进粒子;(5)在边界上添加或移除粒子;(6)执行碰撞过程.如图2 所示.

图2 粒子模拟方法Fig.2 Scheme of the PIC-MCC simulation

可以说,描述低温等离子体的粒子模型与流体模型的主要物理方程是相对明确的,可以通过不同的数值方法求解这些物理方程,比如根据需要选择使用有限元、有限差分及边界元等数值方法来实现;即使使用相同的数值方法,所采用的具体算法也可以是不同的,如求解漂移扩算近似的SCG 算法与ISG 算法等.因此,粒子模拟与流体模拟的数值实现方式通常是比较多样性的.

1.2 数据驱动模型

基于对大气压射频放电的理解,特别是对其动理学特性的深入分析,本文构建了一个具有4 层隐藏层的DNN,如图3 所示.该DNN 是一个基于TensorFlow平台开发的具有GPU 加速的全连接多层反向传播神经网络,由输入层、隐藏层和输出层3 层结构组成,每个隐藏层内有30 个神经元.该DNN 网络结构是经过隐藏层层数、神经元个数以及激活函数的各种组合试验而得到的.一般来说,增加隐藏层层数可以增加网络的表示能力和学习能力,每一层隐藏层都可以学习到数据的不同抽象特征,这些特征逐层组合可以形成更高级和复杂的特征表示.增加神经元个数能够增加每个隐藏层的表示能力,提供更多的自由度,使网络能够学习到更复杂的函数映射.但随着DNN 隐藏层层数和神经元数量的增加,网络的参数量和计算复杂性也会随之上升,导致训练时间增加.本文所构建的DNN 是通过反向传播算法来更新网络参数的,而深层网络在反向传播过程中可能面临梯度消失或梯度爆炸的问题,这可能导致训练过程变得困难.特别是在训练数据有限的情况下,DNN 可能会过度依赖训练数据中的噪声或不重要的特征,导致过拟合问题的出现.在对DNN 结构的不断调整中发现,在探究一维射频放电特征时,增加隐藏层的层数和神经元的个数都会导致训练时间的明显提升.与增加神经元个数相比,增加隐藏层的层数更能明显提高训练准确度,但是当隐藏层层数过多时,提升效果将不再明显.

图3 基于大气压射频放电特性构建的DNN 示意图Fig.3 Schematic of DNN constructed based on the characteristics of atmospheric RF discharges

进一步说,由于DNN 处理的对象是数据,因此DNN 的隐藏层层数、神经元个数及激活函数等参数是由数据的特点决定的.比如有的数据变化比较剧烈(数据梯度大),而有的数据变化比较平缓,这就需要对隐藏层的层数与神经元的个数进行调整,使模型训练时间及预测精度之间达到某种平衡.一般说来,低温等离子体数据的特点是由相应放电的物理性质来决定的,比如本文研究的射频放电,其电流电压的变化是连续的、比较平缓的,而另一种常用的大气压脉冲放电的电流则是近乎突变的、非常剧烈的.显然这两种放电所产生的电流数据具有不同的特点,因此需要对DNN 结构做出相应的调整.本文研究大气压射频放电的DNN 中将隐藏层层数设置为4 层,每层的神经元数目设置为30 个,4 个隐藏层中依次采用ReLU 函数、tanh 函数、tanh 函数和sigmoid 函数作为激活函数.首先,ReLU 函数能够高效地映射放电特性的突变;其次,采用两个tanh 函数能够实现对放电特性的进一步拟合,达到较好的预测精度;最后,使用sigmoid 函数对预测曲线进行平滑处理[35].该DNN 的输入参数为放电条件(如电压幅值、驱动频率和放电间隙等),输出为大气压射频放电的各种物理量,例如电场强度、产物粒子密度和电子温度等.

实际上,具有J层神经网络的DNN 的输入输出关系映射可以表示为

式中,Yout和Xin分别表示DNN 输出层的输出和输入层的输入;和Yj分别表示第j层神经元的前馈传递函数及其输入;θ=｛W,b｝为DNN 训练过程中需要被优化的参数,W和b分别为权重和偏置;σ为激活函数.DNN 通过权重W、偏置b以及激活函数σ将每层神经网络相互连接,DNN 的训练就是通过不断地优化θ=｛W,b｝,逐步逼近DNN 的输入-输出映射关系,从而使得DNN 的输出结果接近于训练集中的给定值.可以说,DNN 通过建立输入输出特征量之间的映射关系,将数值模拟中控制方程的求解转化为不断更新权重和偏置参数的优化学习算法,这极大提高了放电等离子体数值模拟的计算效率.在本工作中,经过训练以后的DNN 可以通过式(5)和式(6)根据输入的放电参数直接获得相应的放电特性.

在DNN 的训练过程中,将标准差函数(MSE)作为DNN 的损失函数,并使用优化器Adam 最小化该损失函数以获得最优的权重W和偏置b.标准差函数表示为

式中,Ndata表示计算域中所包含的采样点的数量;ys为数值模拟的计算结果,而yp则是DNN 模型的预测结果.此外,在DNN 的验证过程中,采用平均相对误差(MRE)来直观地描述预测数据与模拟数据之间的差异

图4 进一步总结了基于数据驱动技术的DNN算法的基本过程.首先,将数值模拟(或实验诊断)得到的数据分为训练集和测试集.这两个数据部分彼此相互独立,其中训练集主要是用来训练DNN 模型中的参数,一般来说要求其能涵盖样本空间,即整个放电参数范围内的所有的信息;测试集用于判断DNN模型的预测性能.如果在测试集内DNN 的预测结果满足要求,则表明该DNN 在给定参数范围内具有良好的泛化性能.随后,通过TensorFlow 自带的命令导出DNN 模型参数,在DNN 的预测过程中只要预加载模型参数后按照模型的输入层结构输入放电参数,就可以迅速获得相应的放电物理量.需要特别指出的是,随着人工智能技术的发展,针对低温等离子体的物理特点以及研究的目的,更多新兴的数据驱动方法将会被引入到低温等离子体的研究中[36-38],上述DNN 只是常用的一种神经网络模型.

图4 基于数据驱动技术的DNN 算法示意图Fig.4 Schematic diagram of DNN algorithm based on data-driven method

需要澄清的是,以DNN 为代表的数据驱动方法能够高效地给出某特定单一物理信息,比如DNN 可以分别单独给出电场强度、粒子密度和电子能量分布函数(EEDF)等放电特性;而传统的粒子模型和流体模型等物理方程驱动的模拟方法则可以一次性给出包含全部物理信息的数据.一般说来,DNN 对于单一放电物理量预测的训练所需要的时间从几十分钟到几小时,但是训练后给出相应的物理信息则只需要0.01 s,这对于需要进行实时监测、反馈并调整的等离子体系统是非常重要的,比如与等离子体医学相关的精准医疗过程[39].

如图4 所示,也可以将单一放电物理量输出的DNN 训练后进行耦合,实现对于多个放电物理量的快速预测.本工作所构建的DNN 模型本质上也支持多放电参数的输入和多物理量的输出,其维度可以由用户自定义,但是多参数的输入输出必然会导致DNN 的训练集数据需求量和训练时间的增加,这对计算平台的计算能力构成了巨大的挑战.

需要进一步说明的是,DNN 所需要的数据可以来自于数值计算,当然也可以来自实验诊断.对于DNN 而言,主要关注的是训练数据的数量与质量,当然在知道其来源的情况下,可以有针对性地调整DNN 的构建,以便在给定数据的情况下获得更好的训练和预测效果.比如正在兴起的小样本学习技术,为基于实验数据进行DNN 的训练研究等离子体性质提供了极大的方便[40-41].

2 结果分析与讨论

2.1 基于数据驱动研究大气压射频放电演化特性

在本节中,使用流体模拟获得的计算数据训练DNN 以实现对于大气压射频放电演化特性的高效研究.在这里将输入电流密度和电极间距作为DNN的输入,研究二者对α 和γ 模式下大气压射频放电特性的影响.在流体模型中,大气压射频等离子体在两个对称的平行板电极之间产生,放电气体为纯氦气.正弦形式的电流密度I=I0sin(2πft)被视为流体模拟的输入,其中I0是电流幅度,f是驱动频率.在本节中,驱动频率被固定为13.56 MHz.大气压氦气等离子体中考虑了电子(e)、两种离子(He+和He2+)、两种亚稳态粒子(He*和He2*) 以及背景气体氦气(He).模型中详细的化学反应和相应的反应速率系数可从参考文献[42]中获得.

在本节中,选取315 组电流密度有效值(RMS电流密度)在0～ 85 mA/cm2之间、电极间距在1.6～3.2 mm 之间的流体模拟数据作为预测电流电压特性的训练数据集,共包含约117 万个时间采样点.选取280 组RMS 电流密度在10～ 85 mA/cm2之间,电极间距在1.6～ 3.2 mm 之间的时均电子密度、离子密度、电场和电子温度空间分布的模拟数据作为预测电子密度、离子密度、电场和电子温度的训练数据集,共有约67 万个空间采样点.需要说明的是,在DNN 的训练过程中,训练集数据的质量对DNN 模型的预测精度和训练速度有着极大的影响.数据量较少的训练集可能会导致DNN 模型的预测精度达不到要求;而如果训练集中包含了太多的数据量,则会提高数值模拟的计算和DNN 训练的时间成本.因此选择合适的训练集数据对于DNN 模型在放电等离子体中的应用是至关重要的,这与数据本身的特点及所需的预测精度等因素都有关.

经过训练以后,在测试集中DNN 的预测结果与流体模拟结果吻合良好,各种放电特征量的平均相对误差均小于0.5%.为了说明DNN 预测的有效性,下文展示了电极间距为2.4 mm、RMS 电流密度分别为30 mA/cm2(α 模式)和80 mA/cm2(γ 模式)时DNN 预测的放电特性与流体模拟结果的对比.图5(a)和图5(b)分别给出了当驱动频率为13.56 MHz时,在α 和γ 模式下DNN 预测的时均电子密度、离子密度和电场的空间分布,并与流体模拟的结果进行了比较.图5 中的虚线和实线分别代表DNN 预测结果和流体模拟结果.如图5(a)所示,当RMS 电流密度为30 mA/cm2时(即放电工作在α 模式下),电子和离子聚集在体等离子体区,其密度最大值出现在放电空间的中心区域.而在鞘层区域,离子密度高于电子密度,形成空间电荷区,导致强电场区域的出现.

图5 DNN 预测的α 和γ 模式下的时均电子密度、离子密度和电场的空间分布与流体模拟结果的比较Fig.5 Spatial distributions of time-averaged electron density,ion density,and electric field in the α mode and the γ mode predicted by DNN with comparison of the results obtained from the fluid simulation

此外,图5 中DNN 预测的电子密度、离子密度和电场的平均相对误差分别为0.17%,0.11%和0.39%,这表明DNN 的预测具有较好的精度.在图5(b)中,当输入电流密度为80 mA/cm2时,射频放电工作在γ 模式.此时,鞘层区域的电场强度较大,大量的带电粒子在鞘层区域产生.这说明在γ 模式下,电离主要由鞘层区域电子雪崩主导.此外,在γ 模式下,DNN预测的电子密度、离子密度和电场与流体模拟结果之间的相对误差分别为0.06%,0.03%和0.43%.这意味着无论是在α 模式还是γ 模式下,DNN 都能实现对于大气压射频放电中带电粒子密度和电场强度空间分布的准确预测.

同时,图6 给出了RMS 电流密度分别为30 mA/cm2(α 模式)和80 mA/cm2(γ 模式)时的DNN 对于时均电子温度空间分布的预测,并与相应的流体模拟结果进行了比较.从图6 可知,DNN 对α 和γ 模式下大气压射频放电中的电子温度也具有很好的预测能力.在α 和γ 模式下,DNN 预测的电子温度的平均相对误差分别为0.07% 和0.05%.与α 模式相比,γ 模式下的电子温度沿电极间隙的降低更加明显.这是因为在γ 模式下,电子在鞘层强电场加速,从而在鞘层内获得较高的能量,同时鞘层内部与边缘的碰撞频率上升,消耗了一定的能量,导致等离子体区的电子温度较低.

图6 DNN 预测的α 和γ 模式下的时均电子温度的空间分布与流体模拟结果的比较Fig.6 Spatial distributions of time-averaged electron temperature in the α mode and the γ mode predicted by DNN with comparison of the results obtained from the fluid simulation

图5 和图6 表明,经过训练后的DNN 能够准确描述大气压射频放电的关键特性,如电场分布、带电粒子密度及电子温度分布等,预测结果与模拟结果表现出很好的一致性,其相对误差均小于0.5%.更为关键的是,与传统的数值模拟方法相比,DNN具有极高的计算效率.一般来说,基于流体模型获得的训练数据,DNN 在经过大约1 h 的训练后就可以实现对于某一放电特征量的精准预测.对于给定参数范围内的任一参数输入,DNN 得到某一放电特征量的真实计算时间仅为0.01 s.而在一维流体模型中,基于(improved Scharfetter-Gummel,iSG)方法[43],流体模型需要运行至少3000 个射频周期才能确保大气压射频放电达到稳态,在给定的计算平台下(Intel Core i7-12700 F CPU,16 GB RAM),这大约需要2000 s.与传统的流体模拟相比,经过训练后DNN 计算效率提高了约105倍.可以说,DNN 的应用几乎实现了大气压下射频放电特性的实时预测.此外,经过训练后的DNN 能够以极高的精度迅速得到给定参数范围内的任一放电参数下的大气射频放电的特性,这将为大气压射频放电特性的研究提供足够多的数据,有利于进一步研究大气射频等离子体的演化行为.

在经过有效性验证后,使用该DNN 对输入电流密度和电极间隙对大气压射频放电特性的影响进行讨论.如图7 所示,经过训练后的DNN 能够以曲面的形式在1 s 内给出不同电极间距下的大气压射频放电的电流电压特性,其中黑色虚线和绿色虚线分别表示不同电极间距下的大气压射频放电的击穿电压和α-γ 模式转变点.根据DNN 的预测,当电极间距从1.6 mm 增加到3.2 mm 时,击穿电压的有效值从148.1 V 增加到270.5 V.击穿电压随电极间距的增加而增加,这与实验测量结果定性一致[15].在图7中,等离子体的微分电导率由正变为负的点被认为是α-γ 模式转变点.当电极间距从1.6 mm 增加到3.2 mm 时,模式转变点的气体电压从448.1 V 增加到497.6 V.当间隙宽度较小时,射频放电在模式转换点之前的需要的放电维持电压更低,这意味着降低电极间距有利于提高大气压射频等离子体的稳定性.

图7 DNN 预测的不同电极间距下大气压射频放电的电流-电压特性Fig.7 Current-voltage characteristics of atmospheric RF discharges predicted by DNN for various electrode spacings

一般说来,基于实验数据与流体模型给出的伏安关系往往是分离的曲线,每一条曲线上的数据点个数也是有限的[5,31],而基于DNN 的计算则可以近乎实时地给出一个伏安特性曲面,如图7 所示,从而将伏安特性随放电间隙的变化更为明确地表现出来,击穿电压与放电模式转化电压的演化规律也更加清晰.可以说,DNN 能够实时给出任意间隙的伏安特性曲线.即,由于极高的计算效率,DNN 可以极大地丰富和强化计算结果,这也是数据驱动技术应用于低温等离子体模拟的重要优势.

如图8(a)和图8(b)所示,DNN 也可以迅速给出不同输入电流密度和电极间距下的电子和离子的最大时均密度曲面.基于给定的计算平台,DNN 只需不到1 s 的时间就可以获得图8 中的最大带电粒子密度曲面.从图8 中可以看到,电子和离子的密度随输入电流密度和电极间距的增大而增大,当RMS 电流密度为85 mA/cm2、电极间距为3.2 mm 时,电子和离子的密度均达到最大值8.38 × 1011cm-3.这表明在较大的输入电流密度和电极间距下大气压射频放电能够产生更多的带电粒子.

图8 DNN 预测的不同RMS 电流密度和电极间距下的最大时均电子密度和离子密度Fig.8 The maximum time-averaged electron density and ion density predicted by DNN as a function of both the RMS current density and electrode spacing

2.2 基于数据驱动模型研究射频微放电动理学特性

在大气压射频放电中,增加驱动频率和减小电极间隙被认为是产生均匀的大体积等离子体的有效方法[15,44].然而,随着放电间隙减小至几百微米量级,等离子体的空间尺度已经可以与等离子体的德拜长度相比拟,等离子体集体效应不再显著,同时微间隙下一般具有较强的电场,导致等离子体呈现出明显的动理学特性[10].本节借助于粒子模型来讨论射频微等离子体特性,并基于粒子模拟计算得到的结果训练DNN 以探究驱动频率对大气压射频微放电中以EEDF 为代表的动理学特性的影响.

在粒子模拟中,大气压射频放电采用了平行板电极结构,并且由正弦电压V(t)=V0sin(2πft)驱动,其外加电压幅值V0为300 V,电极间距固定为570 μm.模型中在边界上考虑了二次电子发射过程,为了简化计算,固定二次电子发射系数为0.1.在本节中,选取86 组驱动频率在55～ 905 MHz 之间的粒子模拟数据组成训练数据集.

首先通过与粒子模拟结果的对比来验证DNN代替粒子模型探究大气压射频微放电动理学特性的可行性.下文中将以驱动频率为100 MHz 时的DNN预测结果和粒子模拟结果的对比为例说明DNN 的有效性.图9 给出了DNN 预测的大气压射频微放电的电场空间分布与粒子模型计算所得到的结果对比.从图9 中可以很明显地观察到,经过良好训练的DNN 所预测的电场空间分布与粒子模型的计算结果高度吻合,即使是在电场的变化较为剧烈的鞘层区域中两者的相对误差也非常小.在图9 中,DNN所预测的鞘层电场峰值分别为-15.24 和15.27 kV/cm,与粒子模型计算结果的相对误差仅为0.05%.而从计算效率的角度出发,粒子模型从模拟放电的开始到稳定阶段大约需要3.6 × 105s,而经过良好训练的DNN 模型仅需0.01 s 左右就能以近乎相同的计算精度得到放电空间内的电场分布,计算效率提高了近7 个量级.

图9 DNN 预测的大气压射频微放电中电场空间分布与粒子模拟结果的比较Fig.9 Spatial distribution of electric field predicted by DNN in atmospheric RF micro-discharge with comparison of the result obtained from the PIC-MCC simulation

图10 中给出了驱动频率为100 MHz 下DNN预测的电子密度空间分布与粒子模型计算结果的对比.从图10 可以看出,DNN 对于大气压射频微放电的电子密度也具有很好的预测能力.当驱动频率为100 MHz 时,电子密度的空间分布呈现为一个以体等离子体区为主导的单峰分布结构,电子大部分集中在放电空间的中心区域,而电极两侧鞘层区域的电子密度较低.此外,DNN 对于电子密度预测的耗时也仅为0.01 s,这进一步说明了DNN 模型预测大气压射频放电等离子体特性的高效性.

图10 DNN 预测的电子密度空间分布与粒子模拟结果的比较Fig.10 Spatial distribution of electron density predicted by DNN with comparison of the result obtained from the PIC-MCC simulation

图11 中给出了DNN 预测的驱动频率为100 MHz时大气压射频微放电的EEDF,并与粒子模拟的计算结果进行比较.从图11 中可以观察到DNN 预测和粒子模拟的计算结果近乎一致,两者的相对误差仅为0.03%.由于不同能量的电子加热过程的差异以及大气压下射频放电的非平衡特性,此时的EEDF呈现一个三温度分布结构,这种分布与低压放电中常见的Maxwell 分布、bi-Maxwell 分布和Druyvesteyn分布形成对比.

图11 DNN 预测的EEDF 与粒子模拟结果的比较Fig.11 EEDF predicted by DNN with comparison of the result obtained from the PIC-MCC simulation

在图11 中可以观察到3 种电子基团: 低能电子(电子能量≤2 eV)、中能电子(2 eV＜电子能量＜20 eV)和高能电子(20 eV≤电子能量),其中2 eV 阈值由鞘层坍塌过程中的限制电位的最小值设定.而中能电子与高能电子之间的20 eV 的分界线则是对应于氦原子的激发阈值[45].此外,在EEDF 中高能尾部部分存在一个明显的“拐点”,这是由于电子在非弹性碰撞范围内较快的能量弛豫所导致的结果.

以上结果表明,经过良好训练的DNN 模型可以快速而准确地描述大气压射频微放电的电场空间分布与电子密度空间分布,以及EEDF 等动理学特性.随后,训练好的DNN 将用于探究大气压射频微放电的频率特性.与传统的粒子模型相比,DNN 将计算时间从几十小时减少到了0.01 s.DNN 作为一种新型的计算工具显著提高了大气压射频放电等离子体的计算效率,可以得到更多的数据以更好地体现放电特性的演化规律.

在图12 中,选取DNN 预测的8 组不同驱动频率下的EEDF 曲线进行定量分析.从图12 中可以观察到,当驱动频率为100 MHz 时,EEDF 曲线呈现一个典型的三温度分布特征,而随着驱动频率逐渐增加至800 MHz,EEDF 曲线逐渐过渡为麦克斯韦分布.通过对图中的EEDF 曲线沿电子能量进行积分计算可以得到低能电子、中能电子和高能电子在每个EEDF 曲线中的占比.如图12(a)所示,当频率为100 MHz 时,低能电子和中能电子的占比分别为92.83% 和7.08%;当频率增加至图12(d) 所示的400 MHz 时,低能电子占比降为80.29%,而中能电子占比升高为19.65%;当频率进一步增加至图12(h)所示的800 MHz 时,低能电子占比下降为62.02%,中能电子达到了37.92%.在相同电压下条件下(注意不是相同功率条件),随着驱动频率的增加,低能电子将被加热,从而使放电空间内的低能电子占比降低而中能电子占比升高,导致EEDF 曲线的低能电子区域逐渐向中能电子区域演化.

图12 DNN 预测不同驱动频率下的EEDF 曲线Fig.12 EEDF predicted by DNNs with various driving frequencies

在大气压射频微放电中,低能电子在整个射频循环周期内被双极电势捕获并被体等离子体区中较弱的电场加热.而中能电子主要由鞘层中二次电子的雪崩效应所产生,除了在射频周期中发生能量弛豫而逐渐失去能量外,在鞘层坍塌时中能电子也会进入电极而消失,因此中能电子并不会存在于整个射频周期内.另外,鞘层内部分来自介质表面的二次电子能够在鞘层区域获得很大的能量,形成高能电子,这些构成了EEDF 曲线中的高能尾部;但由于大气压射频放电的高碰撞性,这些高能电子突破鞘层进入体等离子体区后缺少足够强的电场对其进行持续的加热,最终也会在几十皮秒内发生弛豫而最终失去能量.由于电子的能量弛豫时间明显地短于射频周期,因此EEDF 曲线在大气压射频放电中很容易受到频率的影响.综上所述,在大气压射频微放电中随着驱动频率的增加,低能电子将逐渐转化为中能电子,而EEDF 曲线也将由三温度分布向Maxwell分布而过渡.因此,借助于DNN 可以深入细致地揭示大气压射频微等离子体的动理学特性.

进一步,基于DNN 极高的计算效率,图13 给出了DNN 预测的大气压射频微放电中驱动频率变化时的EEDF 演化曲面图.DNN 只需要1 s 左右的时间就能获得图13 所示的EEDF 三维图,清晰地给出EEDF 随驱动频率的连续变化.从图13 中可以观察到,随着驱动频率的增加,低能电子部分呈现一个较为明显的下降趋势.在频率较低时,EEDF 曲线为一个明显的三温度分布.随着频率的增加,EEDF 曲线变得更加平滑,由三温度分布逐渐地向Maxwell 分布过渡.而若要从粒子模拟中获得同样的大量数据,则至少需要几百小时的计算时间.这再次说明,基于DNN 的计算可以快速给出海量数据以强化展示模拟效果.

图13 DNN 预测的大气压射频微放电中EEDF 的频率演化趋势Fig.13 EEDF predicted by DNN in atmospheric RF micro-discharge with various driving frequencies

3 结论与展望

本研究以DNN 在大气压射频放电等离子体中的计算为例,讨论了数据驱动方法在低温等离子体模拟中的应用.在这项研究中,将流体模拟和粒子模拟获得的计算数据作为DNN 的训练数据.通过将预测结果与数值模拟结果进行比较,验证了DNN 预测大气压射频放电特性的可行性.对于DNN 自身结构的构建而言,需要综合考虑预测精度、训练时间及训练集数据量等因素.本研究中,在通常的计算工作站上经过大约1 h 的训练后,DNN 只需要约0.01 s即可获得大气压下射频放电的特定物理信息,比如电子密度、电场强度和电子温度等.可以说,随着放电参数的输入,DNN 几乎可以实时地输出放电特征量.而流体模拟和粒子模拟分别需要大约半个小时和几十个小时才能获得一组稳定的模拟结果.在与传统的数值模拟相同的计算精度下(相对误差小于0.5%),经过训练后DNN 的预测效率较传统数值模拟方法的计算效率提高了约105～ 107倍,当然这里并不包括训练DNN 所需的时间.这意味数据驱动的计算模型可以近乎实时地给出低温等离子体的物理信息,这对于在大气压下一些需要实时监测与调控的等离子体应用具有重要的价值,特别是与智能化相关的应用中会起到关键性的作用.此外,经过训练后的DNN 可以迅速地获得给定范围内任一放电参数下的大气压射频放电特性,这意味着DNN 能够在有限的训练数据的基础上,给出大量的计算数据,从而可以极大地强化数值模拟效果.比如图7 给出的伏安特性曲面与图13 给出的EEDF 曲面.

简单地说,以流体模拟与粒子模拟为代表的传统低温等离子体物理模拟方法虽然受限于计算效率,但是可以一次性给出放电等离子体的全部物理信息,甚至如粒子模拟可以精确地给出放电等离子体的动理学特性,是揭示等离子体物理特性的根本方法.以DNN 为代表的数据驱动方法,虽然可以大幅提高计算效率,乃至可以做到“实时”给出放电等离子体的物理信息,但是一般只能给出特定的单一物理信息,比如对于预测电子密度的DNN,由于只通过训练获得了电子密度数据信息,也就只能预测电子密度的信息,而对电场强度、电子温度等信息则需要训练其他DNN 给出.

从另一个角度来看,本文讨论的DNN 数据驱动模型,虽然有极高的计算效率,能够给出海量的反映等离子体性质的计算数据,但是训练数据本身来源于粒子模型或流体模型,这意味着DNN 给出的数据信息一般不会超出现有粒子模型与流体模型所能给出的物理现象,即现有的DNN 模型可能不具备发现新物理规律的能力.然而,随着人工智能技术的进一步发展,新的神经网络技术,比如PINNs[36],DeepONet[37],FNO[38]等将有可能进一步提升与优化现有的粒子模型与流体模型的实现方式,比如借助于神经网络逼近而不是传统的离散化方法来实现粒子模拟与流体模拟,这可能会极大地提高计算效率,并平滑推进高维模拟,大幅优化模拟结果,进而推动发现新的等离子体物理规律.

可以说,以DNN 为代表的数据驱动技术为低温等离子体的计算带来了一种全新的且极具发展前景的工具.可以预见,在未来的研究中,粒子模型与流体模型将继续在揭示等离子体物理性质方面发挥重要作用,先进的数据驱动技术也会有效弥补现有流体模型和粒子模型在数值实现方式上的不足,为发现新的等离子体物理规律提供可能.另一方面,在许多需要实时检测与反馈的等离子体应用中,尤其是以智能化为特色的放电等离子体应用中,数据驱动技术将成为不可或缺的工具.

本研究中的Python 程序及训练数据集已开源:https://github.com/SDU-HV-Plasma/DNN2RF.git.