基于GAF-CNN的n/γ甄别方法研究

2024-02-20 03:25黄坤翔张江梅王嘉麒
原子能科学技术 2024年2期
关键词:比较法中子电荷

黄坤翔,张江梅,王嘉麒,苏 覃

(1.西南科技大学 信息工程学院,四川 绵阳 621000;2.西南科技大学 核废物与环境安全国防重点学科实验室,四川 绵阳 621000)

中子探测在许多研究和应用领域均有涉及,如粒子物理学、材料科学、宇宙射线探测乃至环境监测、油井探测与核医学等[1-2]。由于中子与周围环境存在非弹性散射及慢中子的辐射俘获等作用[3],使得中子射线的产生通常伴随着大量不易被物理屏蔽的γ光子,而γ射线不仅对人体的危害程度大,同时也会与中子同时作用于闪烁体探测器,进而影响对中子射线的探测效果。因此,不论是对于辐射防护还是对于提高中子探测精度,研究在n/γ混合辐射场中实现n/γ有效甄别均有着重大的意义。

中子和γ射线依据其脉冲衰减时间不同,一般使用脉冲形状甄别(PSD)方法进行区分,其主要可以划分为时域分析法、频域分析法和机器学习法3大类。时域分析法中最为经典的甄别方法有电荷比较法[4]、上升时间法[5]、过零时间法[6]和脉冲梯度法[7]4种,虽然这些方法已能满足大部分工程需求,但对噪声十分敏感且只能提取单一的时域特征。频域分析法中常见的有频率梯度分析法[8]和小波分析法[9]等,它们抗干扰能力强,但对硬件采样性能要求较高且也仅能提取频域特征。机器学习法是近年来新兴的方法,以聚类法[10]和人工神经网络法[11]为代表,其中后者是探索PSD极致性能的重要技术手段,目前应用在n/γ甄别的主流网络有BPNN和卷积神经网络(CNN)两种。宋海声等[12]利用电荷比较法与频率梯度分析法选取学习样本,通过BP神经网络对样本进行训练后完成n/γ甄别工作。Griffiths等[13]开展了使用一维CNN架构进行PSD方法研究,结果表明比传统方法效果更好。Lu等[14]设计了一种基于二维矩阵格式输入的CNN PSD方法,其甄别性能优于电荷比较法和使用一维格式的CNN方法。然而,目前几乎没有一种人工神经网络甄别法本身具备同时保留核脉冲时域和频域特征的能力。本文受文献[15]启发并参考格拉姆角场(GAF)在其他信号识别领域[16]中对时间序列二维化的应用,提出一种基于GAF-CNN的n/γ甄别方法,既能有效保留核脉冲的时域特征,也能通过CNN将频域特征利用起来。

1 实验平台搭建与数据获取

数据采集实验平台系统结构如图1所示,使用239Pu-Be作为中子源为探测器提供n/γ混合辐射场;探测器是由北京玻璃研究院生产的尺寸为φ1.4 cm×2.6 cm的Cs2LiYCl6:Ce3+(CLYC)闪烁体晶体和日本滨松公司生产的R2076光电倍增管(PMT)组成,高压偏置电源为光电倍增管提供-1 kV的增益电源;使用型号为泰克DPO4034的数字示波器以2 GS/s的采样率对辐射脉冲波形进行采集,通过USB总线传输到计算机进行脉冲数据样本的存储;采集获取了n/γ总计20 000个脉冲样本,每个脉冲样本均为10 000×1的一维序列。

图1 数据采集实验平台系统结构

2 格拉姆角场和CNN分类器原理

2.1 格拉姆角场

格拉姆角场[17]是将一维时间序列转化成二维图像的方法,该方法将原本定义在典型笛卡尔坐标系下的时间序列在极坐标系下重新进行表示。通过GAF图像转换过程,可将时间序列的本质特征完整的转化到图像当中,由于n/γ脉冲样本是典型的时间序列,因此考虑使用GAF来最大程度地保留n/γ甄别所需的脉冲时域特征,具体转化过程如下。

对于一个给定的一维核脉冲样本数据向量D={d1,d2,…,dn},其由n个按时间顺序测量的实测值组成,使用式(1)将该样本数据归一化到[-1,1]区间:

(1)

(2)

经过式(2)表示后的极坐标编码具有唯一性和时间相关性这两个重要的性质,因此它可以在[0,π]角度范围内随着时间戳变化映射为一个随角度变化弯曲的唯一极坐标曲线,且该曲线相对于笛卡尔坐标系下的原始脉冲序列保留了数据间绝对的时间关系。

使用Gram矩阵G来量化编码后数据间的特征相关性,其定义为:

(3)

(4)

式中:φi(i=1,…,n)为第i个极坐标点的编码夹角;n为核脉冲数据的长度;I为长度为n的单位行向量。GAF保持高时间依赖性和时间相关性,其对角线随时间增加而自左上角到右下角递进,同时保留了一维核脉冲序列的值与基于时间的位置信息,为神经网络模型学习到高层次脉冲形状特征提供了基础。以一个中子脉冲样本为例,图2为核脉冲的GAF转化过程。

图2 核脉冲的GAF转化过程

2.2 CNN分类器

典型的CNN分类器由卷积层、池化层、全连接层及逻辑激活输出层等部分组成[18]。卷积层通过一组可学习参数的滤波器在输入数据上进行滑动卷积操作,这些滤波器也被称为卷积核,它可将如图像等输入数据转换为多个特征映射,从而实现不同局部特征的提取过程,卷积一般计算过程如式(5)所示。

(5)

式中:y为输出的特征映射;σ为非线性激活函数;xi-r,j-c为第i-r行第j-c列的输入数据,其中r和c表示卷积核的中心位置,具体取决于卷积核的大小与卷积的步长,通常为奇数;wi,j为卷积核第i行第j列的权重,为可学习的参数;b为偏置项;n为输入数据的维度。

池化层是一种下采样操作,通常与卷积层成对使用,它可以减小卷积层输出的大量特征图的空间维度,同时保留重要的特征信息。池化层常用的是最大池化和平均池化两种方式,前者选择窗口内的最大值作为输出,后者选择窗口内的平均值作为输出,基于n/γ核脉冲由于信号微弱从而易受耦合噪声扰动的特点,本文采用最大池化操作如式(6)所示。

yi,j,k=max(xi+p,j+q,k)

(6)

式中:yi,j,k为输出特征图;xi+p,j+q,k为输入的第i+p行第j+q列第k个通道的特征图;p和q为池化窗口内的坐标步长。

全连接层在CNN中往往使用于末尾,其将前面所有层的输出结果按照神经元模型规律进行完全连接,它可以集中卷积池化操作后的所有特征,并将其输出,通过逻辑激活函数映射到归一化区间用于分类,式(7)为全连接层的逻辑表示:

(7)

式中:xi为输入的第i个特征向量;yo为输出的特征映射;n为输入特征的维度;wi为每个输入向量对应的权重,为可学习的参数;f为逻辑激活函数。

3 甄别算法实现

3.1 电荷比较法的优化与实现

1) 原始脉冲数据集预处理

由于电荷比较法受样本噪声等因素影响较大,因此需要对原始脉冲信号进行一系列预处理操作,其一般过程为:(1) 平滑操作;(2) 基线调零操作;(3) 归一化操作[19]。平滑操作采用滑动平均滤波算法对脉冲波形整体进行算术平均运算,基线调零操作选取了信号前100个点进行均值计算以得到基线位置,归一化操作是对脉冲波形进行幅值归一化,将脉冲幅值缩放到0~1区间内。图3为预处理前后的n/γ脉冲波形对比。

a——原始脉冲信号;b——预处理后的脉冲信号

此外,为防止脉冲堆积对甄别效果产生影响,在预处理过程中还应专门将堆积信号去除,由于所用中子源的强度不高,脉冲堆积仅为小概率事件,因此本文通过人工方式进行堆积样本的剔除,最终得到样本个数为19 971的原始n/γ脉冲数据集,数据集的维度为19 971×10 000。

2) 电荷比较法实现

电荷比较法根据中子和γ射线在闪烁体中作用的时间常数不同,会出具有快慢两种成分的电荷,即最终n/γ脉冲会产生不同形状的上升沿和下降沿,可以选择不同的波形积分窗口等效为电荷量进行甄别[20]:

Q=Qr+Qf

(8)

式中:Q为总积分量;Qr为脉冲上升沿的积分量;Qf为脉冲下降沿的积分量。

通常根据实际情况,会在Qr、Qf、Qr/Q、Qf/Q和Qr/Qf中选择一项作为甄别依据,而在实际操作中为提高甄别效果,Qr和Qf往往会在更为宽泛的积分窗口进行变化;本文选择Qr参数进行n/γ脉冲甄别,从信号起始位到上升沿的终止位作为最小积分时间窗,以此积分窗口作为下限进行动态变化,图4为当积分窗口选为2 000时电荷比较法甄别统计结果。为评估不同PSD方法性能的强弱,一般定义FOM作为品质因子来进行判断,定义[21]如下:

(9)

图4 电荷比较法甄别统计结果

式中:μ1和μ2分别为甄别统计结果中γ峰和中子峰的峰位;FWHM1和FWHM2分别为甄别统计结果中γ峰和中子峰的半高宽。根据式(9)可计算出图4所示甄别效果的FOM为1.57。

3) 电荷比较法的窗口优化

电荷比较法的实际PSD效果在很大程度上受积分窗口选择的影响,为使得具有最佳的PSD性能,需要对积分窗口参数进行遍历和优化[14]。本文将积分窗口设置在[1 500,8 500]范围内,以步长为500进行遍历计算,分别得到不同窗口所对应的FOM,以选出FOM最大时所对应的积分窗口。图5为电荷比较法优化结果,当积分窗口选为3 000时,电荷比较法具备最好的甄别效果,此时FOM可达到1.76。可见此FOM已经能满足实际使用需求,这是因为实验所用CLYC探测器的性能本身就十分优秀,同时所用中子源提供的混合辐射场也远高于传统意义上的弱场,因此电荷比较法能具备不错的甄别效果。经统计,原始数据集经过最佳性能的电荷比较法甄别后,得到γ脉冲个数为10 430,中子脉冲个数为9 541。

图5 电荷比较法优化结果

3.2 基于GAF-CNN的脉冲形状甄别方法实现

1) GAF脉冲数据集的制作

GAF脉冲数据集的制作过程如图6所示。首先将原始脉冲数据集遍历,分别读取每个样本并进行GAF转化;其次通过窗口优化后的电荷比较法对该n/γ样本进行分类,将γ脉冲的标签设为0,中子脉冲的标签设为1;最后将该样本的GAF图像存储到本地,循环往复直到遍历完整个原始脉冲数据集。

图6 GAF脉冲数据集制作流程图

在使用GAF将n/γ脉冲样本转化为GAF图像的过程中,由于原始样本较长,导致直接转化后的图像分辨率高达10 000×10 000,这会极大增加运算开销,因此需对GAF转化过程增加降维操作。

本文使用传统的分段近似聚合(PAA)算法,在保留原始一维序列重要特征的情况下将其缩小重塑成长度为100的序列,最终在经过GAF转化后得到像素分辨率为100×100、通道数为3的GAF图像。在制作完成的GAF脉冲数据集中随机抽取γ和中子各5个样本,两种类型的GAF样本示例如图7所示。

a——γ脉冲样本;b——中子脉冲样本

2) CNN分类模型设计与实现

CNN在目标检测、图像分类等领域展现出了极为优秀的性能,它通过多级抽象特征进行有监督学习,最终实现样本分类。一般来讲,使用CNN完成分类任务需要大量的样本支持,同时要求样本信息具备多样性和完整性,且所预测的问题必须实际可行。由于n/γ甄别领域能够获取较多的样本量且样本具有较高的区分度,具备可预测性,因此将CNN应用于该领域是十分契合的。本文基于大量实验后,在经典的LeNet CNN模型基础上进行适应性修改,最终设计能高效解决n/γ甄别问题的轻量级分类网络框架,该网络具有1个输入层、两个卷积层、两个池化层、1个全连接层和1个输出层,如图8所示。

图8 用于n/γ甄别的CNN分类框架

将准备好的n/γ脉冲信号GAF图像输入到CNN中,为保证图像特征的完整性,使用零填充方式进行卷积。卷积过程采用ReLU函数作为式(5)中的σ非线性激活函数,其定义如式(10)所示,该函数在提升CNN模型非线性拟合性能的同时,基于其简单性和计算效率,还有助于提高模型训练的收敛速度。

ReLU=max(0,x)

(10)

将经过卷积后的特征图输入到最大池化层中以减少数据维度,能有效地减少网络层数和训练时间。在连续两对卷积池化操作后将特征图通过扁平层进行一维展宽,将得到一维的全局特征映射输入到全连接层中,采用Sigmoid函数作为式(7)中的f逻辑激活函数。该函数可将神经网络的输出进行概率化表示进而实现分类的目的,其一般形式如式(11)所示。Sigmoid在浅层神经网络中使用十分广泛,是解决二分类问题的最佳选择之一,十分适用于n/γ甄别场景。

(11)

此外,为提高网络的泛化能力,在每组卷积池化操作和全连接层后都额外添加了随机失活层。该层在训练过程中使得每个神经元都有一定概率被丢弃,可减少神经元之间的依赖性,从而使得CNN模型更加稳定。本文将两组卷积池化操作和全连接层后的随机失活层概率参数分别设为0.25、0.25和0.5,能实现良好的效果。

在完成以上CNN正向推理过程后,需要计算目标与实际结果的损失值来指导模型的训练过程。本文使用二元交叉熵损失函数来衡量模型训练的损失值,计算公式为:

(1-yt,i)lg(1-yp,i))

(12)

式中:L为损失值;N为样本总数;yp,i和yt,i分别为第i个样本的预测输出值和真实标签值,其值只能为0或1。

通过CNN的反向传播,使用梯度下降法调整各层可学习参数来降低损失值,重复正向推理步骤直到损失值减小至预设区间内收敛,此时CNN分类器便完成了最终训练。表1列出了CNN分类模型的关键网络结构与各层网络参数。

表1 CNN分类模型的关键网络结构与各层网络参数

4 实验结果对比

将GAF脉冲数据集的70%作为训练集、30%作为测试集,来验证GAF-CNN甄别方法的效果,其中训练集样本数为13 980、测试集样本数为5 991。使用TensorFlow Keras平台搭建CNN模型,以批量大小参数为16的设置进行训练,每轮训练对模型进行了874次数据投喂;由于数据集样本量足够大,仅训练3次便可以得到损失值近乎收敛的训练结果。在相同数据集分割配置和相同批量大小等实验条件下,对使用二维卷积的传统CNN甄别法进行训练,该方法是将原始脉冲数据集的一维样本序列通过简单折叠的方式预处理成二维矩阵[14],再输入到卷积层进行卷积;经实验,在相同结构的CNN分类模型下需要训练6次才能得到损失函数相对收敛的训练结果。图9为两种CNN甄别法训练过程中损失值的变化趋势,可看出GAF-CNN的损失函数具有更快的收敛速度。

图9 CNN损失函数收敛曲线

为评估两种CNN甄别方法的甄别性能,定义辨别误差率(DER)来作为评价指标[11],使用式(13)来计算γ射线与中子的DER,即CNN甄别错误的样本数与数据总样本数之比。

(13)

式中:Nγ和Nn分别为γ射线与中子的测试样本数;Nγ-CNN与Nn-CNN分别为使用CNN甄别法甄别后γ射线与中子的测试结果数量。表2所列为两种CNN甄别法的学习性能对比。由表2可知,两种CNN甄别法均能达到较低的辨别误差率水平,对n/γ甄别效果良好,且GAF-CNN的辨别误差率较传统CNN甄别法相对降低约38.8%。

表2 两种CNN甄别法的学习性能对比

在CNN甄别模型训练结束后,为探究CNN甄别法和电荷比较法的性能差异,分别对GAF-CNN法与传统CNN法进行甄别统计测试以获取FOM。首先将测试集中的样本输入模型,使用回调函数分别获取每个样本在模型最终分类前所输出的在0~1区间的正类样本概率,再将0~1区间10 000等分进行输出结果计数统计,甄别结果如图10所示。由图6可知,正类样本被设置为中子,因此在实际分类中输出值大于0.5则判定为中子,反之则判定为γ射线。

a——GAF-CNN甄别法;b——传统CNN甄别法

由图10可看出,GAF-CNN甄别法的输出分布相较于传统CNN甄别法更趋于0和1两极,结合图9中GAF-CNN的损失值收敛速度更快的实际情况,说明使用GAF进行数据二维化相比于使用一维样本折叠成矩阵的二维化方式能够保留更多维度的脉冲时域信息,而进行卷积操作则有利于保留脉冲的频域信息,因此在融合了时频特征后,GAF-CNN能提取更加准确有效的n/γ脉冲形状特征。

将电荷比较法、传统CNN甄别法和GAF-CNN甄别法进行综合性能对比分析,综合测试后将数据列于表3。对测试集中的5 991个脉冲样本分别使用3种方法进行了甄别处理,均能满足甄别需求。同时,CNN甄别法相较于电荷比较法的甄别效果明显提高,在样本没有进行专门滤波处理的情形下,其FOM能提升至少两个数量级;而GAF-CNN甄别法在轻量级网络分类框架上的FOM相对于传统CNN甄别法有1个数量级的提升。

表3 3种n/γ PSD方法的性能对比

在处理时间方面,两种CNN甄别法均比电荷比较法的甄别处理速度更为快捷。其中GAF-CNN法可达到1.2 s,比传统CNN法耗时稍高,可见为进一步提高甄别性能上限,所输入的3通道GAF图像相比于传统CNN法中输入的折叠矩阵包含了更多维度的脉冲形状信息,因此增加了处理脉冲信号的时间。

5 结论

本文实现了一种基于GAF-CNN的PSD方法,并与传统CNN甄别法和电荷比较法进行了对比。结果表明,GAF-CNN能同时获取脉冲的时频特征,相比于传统CNN法具有更低的辨别误差率。此外,GAF-CNN在甄别品质上有着较大的性能突破,在本实验条件下,仅使用轻量级网络模型的FOM便可比电荷比较法提升3个数量级且比传统CNN法提升1个数量级。而在处理时间上,GAF-CNN甄别法比电荷比较法有着明显地提升。同时,利用TensorFlow框架实现的轻量级GAF-CNN甄别网络使得CNN PSD算法的嵌入式部署成为可能,为高性能n/γ复合探测能谱仪的研制提供了一种新思路。

猜你喜欢
比较法中子电荷
电荷知识知多少
比较法:立法的视角
电荷守恒在化学解题中的应用
3D打印抗中子辐照钢研究取得新进展
比较法学习Co和Co2
基于PLC控制的中子束窗更换维护系统开发与研究
DORT 程序进行RPV 中子注量率计算的可靠性验证
静电现象有什么用?
库仑定律的应用
中子深度定量分析的相对分析法