基于ＳＳＡ和ＥＬＭ的医院网络入侵特征选择与检测分析

2023-08-09 07:08杨威

计算机应用文摘·触控 2023年15期

摘要：将医院网络入侵行为作为研究对象，提出基于SSA和 ELM 的网络入侵特征选择模型，有效实施网络入侵行为检测。该方法应用 SSA 算法优选网络入侵特征属性，用于改进 EI.M 网络分类性能，通过减少模型输入特征数，来降低计算复杂度。将模型用于医院网络 Dos，Probe，R2L.等攻击行为样本检测，结果表明检测准确率能够达 90%以上，检测时长在 0.5 s 以内，误报率不超 0.3%，能满足医院网络入侵检测高效、准确、可靠的检测要求

关键词：SSA;ELM;医院网络：入侵检测

中图法分类号：TP393文献标识码：A

１引言

随着网络技术的普及与应用，各种网络攻击、非法入侵层出不穷，给网络信息安全带来了较大威胁。医院内部网络一旦遭受非法入侵，容易造成患者隐私数据泄露、丢失，从而影响医院正常运营，甚至引发严重的经济损失和社会影响。在网络入侵检测方面，对各种机器学习方法进行了研究，如采用布谷鸟算法和支持向量机实现入侵检测，但仅在处理小样本时可以达到较高准确率，而处理海量数据时容易出现滞后情况［１］；采用网络搜索法依靠特征参数寻优，尽管能够通过分类器分类，但遍历搜索列表中每组参数将造成搜索时间过长，模型训练效率较低；采用麻雀搜索算法（ＳＳＡ）直接在相邻特征参数间搜索，更新判断参数选取方向，舍弃无法优化分类器性能的参数，可以迅速查找到优秀特征参数组［２］。在此基础上，应考虑入侵检测数据不均衡的问题，为避免直接采用机器学习方法造成少数类分类精度较低的问题，需从算法层面着手，结合入侵行为相对正常行为数量少的特点，采用极限学习机（ＥＬＭ）建立单隐层前馈神经网络，设定隐含层神经元快速学习，以获得良好的泛化性能。综上所述，提出采用基于ＳＳＡ算法和ＥＬＭ算法的医院网络入侵特征选择和检测模型，通过优化特征参数、模型分类性能，从而获得较高整体检测效率，提升入侵行为检测准确率。

２网络入侵特征选择模型

２．１ＳＳＡ算法

作为群体智能优化方法，ＳＳＡ算法模仿麻雀觅食和逃避捕食者的过程，按照比例将整个麻雀群划分为发现者和追随者，并随机选择个体兼任警戒者［３］。其中，发现者能量储备较高，负责食物搜索，为追随者指明食物方向；随着追随者能量下降，将跟随发现者去往觅食位置获取能量；警戒者在发现捕食者入侵后，将向群体发出警报，以确保群体安全。采用该算法，假设麻雀群体在Ｎ×Ｄ维空间内寻找食物，Ｎ为群体规模，Ｄ为搜索优化维度。空间内食物Ｆ＝［Ｆ１，Ｆ２，…，ＦＤ］Ｔ，麻雀中个体位置为Ｘ＝［Ｘｎ１，Ｘｎ２，…，ＸｎＤ］Ｔ，ｎ＝１，２，…，Ｎ，搜索空间上限为ｕｂ＝［ｕｂ１，ｕｂ２，…，ｕｂＤ］Ｔ，下限为ｌｂ＝［ｌｂ１，ｌｂ２，…，ｌｂＤ］Ｔ，则能够完成群体初始化，得到：

式中，Ｅ（Ｓ，β）为网络输出误差值，Ｈ為深入矩阵，β 为输出权重矩阵，Ｔ为样本目标输出矩阵。采用ＥＬＭ实现非线性问题优化，应用极限定理、差值定理等使网络隐含层激活函数达到无穷小，确认输入层权值和隐含层阈值不会给输出层结果输出带来明显影响。因此，采用ＥＬＭ可以将训练过程转换为求解最小二乘数β 的过程，得到：

β ＝Ｈ＋Ｔ（８）

式中，Ｈ＋为Ｈ的广义逆矩阵，通过正交法获取，能够求解得到唯一的最小值。

２．３基于ＳＳＡ的ＥＬＭ模型

建立基于ＳＳＡ算法的ＥＬＭ模型实现网络入侵特征选择，能够通过参数优化解决训练样本偏差较大的问题，以避免产生病态矩阵，从而给网络信号分类器性能带来不良影响［４］。为将两种算法结合，需先设计适应度函数：

ｆｉｔｎｅｓｓ＝ａｒｇｍｉｎ（ＴｒａｉｎＥｒｒｏｒＲａｔｅ＋ＴｅｓｔＥｒｒｏｒＲａｔｅ）（９）

式中，ｆｉｔｎｅｓｓ为最终选择网络入侵特征，ＴｒａｉｎＥｒｒｏｒＲａｔｅ为训练集错误率，ＴｅｓｔＥｒｒｏｒＲａｔｅ为测试集错误率，使这两个数值达到最小，能够获得最高的网络入侵检测准确率，在可选择的网络入侵特征最少的情况下选择最佳的特征组合。将麻雀群体中发现者的位置向量当成是特征集，ｘｉ为一个特征，采用二进制编码方式，在第ｊ个入侵行为特征被选中时，ｘｉ取值为１，反之则取值为０，确保从Ｎ个特征中识别ｉ个寻优特征集合。采用ＳＳＡ算法实现ＥＬＭ优化，流程如图１所示，特征子集与训练数据集相对应，并根据个体适应度判断是否达到终止条件，以获得最优特征子集，从而将其应用于网络入侵检测。

３基于ＳＳＡ和ＥＬＭ的医院网络入侵检测

３．１样本分析

采用ＳＳＡ?ＥＬＭ模型实现医院网络入侵检测，并结合医院网络建设情况，将ＫＤＤＣＵＰ９９网络作为测试对象，常见入侵包含Ｐｒｏｂｅ，Ｄｏｓ，Ｕ２Ｒ，Ｒ２Ｌ几种网络攻击。在网络训练阶段，使用２８５６个样本展开训练，其中正常样本１９８３个，攻击样本不到９００个，每个样本包含４０多种属性。在网络测试阶段，测试样本数为２２３４个，正常样本数为１４５３个。在样本中，Ｄｏｓ占比最大，约占３５％，其次为Ｐｒｏｂｅ，约占３０％，Ｒ２Ｌ样本数约占２５％，Ｕ２Ｒ样本数在１０％左右。

３．２检测流程

采用ＳＳＡ?ＬＥＭ模型进行入侵检测，输入层神经元数量设定为４１，隐含层神经元数量为８３，激励函数为高斯核函数。使用的测试设备配备２．４ＧＨｚ的ＣＰＵ，以及４ＧＢ内存，芯片为ＩｎｔｅｌＣｏｒｅｉ５，操作系统为Ｗｉｎｄｏｗｓ９。在开展实验室仿真测试时，使用Ｍａｔｌａｂ软件。

按照入侵检测流程，先完成医院网络入侵检测数据读取，将数据划分为训练集和测试集，最后统一进行归一化处理。在利用计算机软件生成ＥＬＭ模型后，需确定层数、各层节点数等，然后采用二进制编码方式完成特征编码。对ＳＳＡ种群进行初始化后，设定种群规模Ｎ，并确定最大迭代次数Ｔ，实际取值为５０次，系统将自动生成麻雀群体。首先，将不同特征属性带入模型训练中，在获得个体初始适应度后，再对发现者、追随者位置进行初始化，最后完成全部成员初始适应度排序，并从中选择最优位置，即食物位置［５］。在标记该位置后，将其定义为发现者，将其他麻雀位置按照适应度进行排序，并定义为追随者。在完成发现者、追随者位置更新后，对群体适应度进行重新计算，找寻具有最佳适应度的麻雀位置，将其作为最新食物位置。基于此，采用随机选择警戒者的方法来确定麻雀移动方向，并对其进行不断寻优，直至获得全局最优位置信息。在经过反复迭代后，达到最大迭代次数，并输出最优位置信息，从而生成医院网络入侵最优特征子集，最后将特征子集输入ＥＬＭ模型中，完成网络入侵检测，输出最终检测结果。

３．３检测效果

为验证算法的有效性，利用训练好的模型进行网络入侵测试，并根据检测准确率和时长等对结果展开评价。根据正常样本正确分类个数与总样本数比值，能够分析得到模型检测准确率。为验证模型可靠性，需要对入侵行为检测的误报率展开分析，即攻击样本错报数量和总数量的比值。

将ＳＳＡ?ＥＬＭ模型和ＥＬＭ模型进行比较，能够得到如表１的测试结果。从Ｄｏｓ攻击检测情况来看，使用传统ＥＬＭ模型和使用ＳＳＡ算法改进后的ＥＬＭ模型均能达到９９％以上的检测准确率，但改进后的模型准确率更高，且检测时间明显缩短。由此可见，两种模型用于常见Ｄｏｓ攻击检测均能达到较高准确率，但由于传统模型反应时间较长，因此无法实现实时检测医院网络入侵行为的目标。从误报率情况来看，采用ＳＳＡ?ＥＬＭ模型可以将Ｄｏｓ攻击误报率从０．０９％降低至０，从而有效地增强网络入侵检测系统运行的可靠性。而针对Ｐｒｏｂｅ等平时并不常见的入侵行为实施检测，采用ＥＬＭ模型的准确率较低，在５０％～８０％之间波动，检测时大多不超１ｓ，尽管响应速度较快，但卻无法有效识别各种网络攻击行为，且对ＵＳＲ攻击的误报率较高，达到了１．６１％，容易给医院网络正常工作带来干扰。采用ＳＳＡ?ＥＬＭ模型进行入侵检测，仅对Ｐｒｏｂｅ攻击检测准确率较低，但也达到了９０％以上，而对ＵＳＲ攻击检测准确率达到了１００％，检测时长则统一控制在０．５ｓ以内，可以达到较高检测效率。此外，ＳＳＡ?ＥＬＭ模型的误报率较低，最大不超过０．３％，能够保证医院网络入侵检测系统的可靠工作。由此可见，采用ＳＳＡ算法能够有效优化ＥＬＭ模型分类性能。

为进一步确认增加迭代次数能否增强模型入侵检测效果，将迭代次数增加至１００次。从测试结果来看，Ｄｏｓ，Ｐｒｏｂｅ，Ｒ２Ｌ，Ｕ２Ｒ的检测准确率分别为９９．９％，９３．２％，９８．９％和１００％，检测时长则分别达到１．２１ｓ，０．１０ｓ，０．３４ｓ和０．０５ｓ，误报率分别达到０．００％，０．０５％，０．００％和０．２３％。由此可见，增加迭代次数对模型入侵检测准确率和误报率的改善效果并不明显，但却造成检测时长增加１倍左右。经过综合考量，应将迭代次数设定为５０次，在降低模型复杂度和冗余度的同时，保证模型用于医院网络入侵检测的高效性和可靠性。

４结束语

基于医院网络面临复杂入侵行为的情况，在当前网络入侵检测算法存在响应速度慢、特征识别率不高等问题的基础上，提出采用ＳＳＡ算法优化ＥＬＭ分类性能，通过最小二乘法快速完成入侵行为特征选择，从而提高网络入侵检测效率和质量。对ＳＳＡ?ＥＬＭ模型建立过程展开分析，然后通过实验验证方式检验模型分类性能，最终确定采用改进后的ＥＬＭ模型能够明显提高对Ｐｒｏｂｅ，Ｒ２Ｌ，Ｕ２Ｒ３种攻击行为的检测准确率，同时能够有效降低对Ｄｏｓ和Ｕ２Ｒ入侵行为检测误报率，并缩短各种入侵行为检测时长。在较少迭代次数下，ＳＳＡ?ＥＬＭ模型即可体现较好的网络分类器性能，以及保持较高检测效率和结果可靠性，因此在医院网络入侵检测领域拥有较好的应用前景。

参考文献：

［１］魏明军，张鑫楠，刘亚志，等．一种基于ＳＳＡ?ＢＲＦ的网络入侵检测方法［Ｊ］．河北大学学报（自然科学版），２０２２，４２（５）：５５２?５６０．

［２］张志飞，王露漫．基于机器学习的网络入侵检测算法研究［Ｊ］．计算机应用与软件，２０２２，３９（１０）：３３６?３４３．

［３］高兵，郑雅，秦静，等．基于麻雀搜索算法和改进粒子群优化算法的网络入侵检测算法［Ｊ］．计算机应用，２０２２，４２（４）：１２０１?１２０６．

［４］陈爱萍．基于ＰＳＯ?ＥＬＭ算法的网络入侵检测研究［Ｊ］．安阳师范学院学报，２０２２（２）：３５?３９．

［５］杨彦荣，宋荣杰，周兆永．基于ＧＡＮ?ＰＳＯ?ＥＬＭ的网络入侵检测方法［Ｊ］．计算机工程与应用，２０２０，５６（１２）：６６?７２．

作者简介：

杨威（１９７６—），网络工程师，研究方向：计算机科学与技术。

基于ＳＳＡ 和ＥＬＭ 的医院网络入侵特征选择与检测分析

基于ＳＳＡ和ＥＬＭ的医院网络入侵特征选择与检测分析