一种时效增强的机载Web流量识别方法

2020-12-08 08:40
无线互联科技 2020年19期
关键词:原始数据数据流时效性

易 灿

(湖南大众传媒职业技术学院,湖南 长沙 410100)

0 引言

由于航空电力技术和群体作战模式的不断推进,机载网络逐渐成了作战信息传递的主要工具和当前航空电子领域研究的热点。为了有效提升数据识别准确率和识别的时效性,文章对贝叶斯网络识别法做了深入研究,并设计仿真实验进行验证。

1 贝叶斯网络流量识别法

通过ISW(初始子流窗口)对原始数据进行预处理得出ISF(初始子流场)样本训练子集,该行为是贝叶斯网络流量识别法的中心思想。为了达到ISW分类器数据流早期识别的目的,需通过利用贝叶斯模型生成的训练子集进行学习来实现。

2 基于贝叶斯网络构造子分类器模型

该章节将前部子流窗口提取的数据流段特征作为训练及测试的对象,从而实现了ISFC(前部子流分类器)的构建。WTTL为前部子流窗口,文章中将其定义为对ISF独立数据记录的窗口,并对ISW采集单个数据流维持了时限。ISW表示ISF数据包的采集数量,依据数据作用的不同,分别对其称作ISW-T(训练窗口)和ISW-C(捕获窗口)。训练窗口的主要作用是对ISF特征提取及训练集过滤;而捕获窗口是针对数据流的识别阶段,捕获测试集中ISF数据流[1]。全文依托ISF特征构建MWDBNC(多窗口贝叶斯网络分类模型),如图1所示。

图1 MWD-BNC模型

2.1 ISW-T的训练集构建

训练集Npos表示大流数量,Nneg表示小流数量,μ为训练集正负数量。基于该训练集正负程度构建的分类器会随着μ的增大而偏向大流。为了避免分类失衡现象的出现,可以设定大流的判定阈值,并对训练集正负比例进行调整,以此来保证大流的识别价值[2]。基于MWD-BNC模型ISW-T对ISF的提取流程,进入ISF子训练集中的是被ISW-T筛选的自身包含较多数量的数据包。以窗口值条件为前提,被滤除ISF训练集的数据包都是在WTTL内捕获的自身数量无法满足窗

口值的原始数据集。因为该情况的出现,为了保证政府样本数趋于平衡,需淘汰原始数据流训练集中的小流。

2.2 基于ISW-C 的数据流线上识别

MWD-BNC模型中,ISW-C实现了线上数据流捕获,ISFC为当前窗口值指定数据流做出判断。假设现在机载Web中大流判别阈值为S,P是窗口截取比为捕获窗口值IC与当前网络大流判别阈值S的比,如公式(1)所示。

(1)

P是ISFC为当前大流识别时效性的反应。IC的逐渐增大,P则越向1靠近,而ISFC的识别时效性则逐渐降低。通过对训练集的分析发现,失衡现象会随着P的增长而减轻。在ISW-C数据流的线上识别过程中,小流是在被捕获阶段就已经被淘汰了,ISFC的预测空间会随着小流淘汰而缩小。造成大流识别时效性下降的主要原因之一就是线上识别过程中数据包数据的不足,为了提升大流识别过程的时效性,MWD-BNC模型对流i做出判决时,P应该采集满足当前所需的数据包。

3 实验分析

3.1 实验配置

在Java环境下,采用机器学习模型实现对数据挖掘的统计、分析、预处理、回归以及聚类等。该实验章节为了验证训练基于贝叶斯构建的分类器,选取了某航空飞行任务重机载网络实际的原始流量数据作为数据集,这些原始数据集保存了在30 min内对所有节点监测的报头信息,可将其称为Anset,以Anset的分布情况设置大流判断阈值为100[3]。

表1是基于Anset中流量样本数据包的分布及特征进行流量提取,其中工包含ISF特征34项,并根据PCA主要特征分析选取算法得到的ISF10项特征,详细情况如表1所示[4]。

表1 数据流ISF的选取特征

3.2 准确性指标对比

本文通过几种方法选取原始数据集Anset,其主要目的是为了验证文章所提方法在机载网络下的大流识别性能,主要提取方法包括:PS-BT(贝叶斯定理的周期性采样方法)、LRU-1、S&H(采样-保持方法)等。以Anset采集数据训练集作为贝叶斯网络分类器构建的基本条件,目的是为了准确验证该模型对大流识别效果有提升作用,证明BNC-PS的识别方法的可信度有显著提升[5-6]。

4 结语

文中提出的时效增强机载网络识别方法是结合航空集群机载网络流量分布的特点,并通过贝叶斯网络分类器模型对原始数据进行预处理实现大流量对象的识别。MWD-BNC模型的构建也是通过贝叶斯网络识别方法展开研究,该模型的构建实现了时间代价敏感的机载网络大流识别。通过分类实验的设置对文中所提方法进行分析,结果表明识别时效性的提升需要保证识别准确性,才能实现大流的早期识别。

猜你喜欢
原始数据数据流时效性
GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
试析如何确保新闻采访的真实性和时效性
一种提高TCP与UDP数据流公平性的拥塞控制机制
全新Mentor DRS360 平台借助集中式原始数据融合及直接实时传感技术实现5 级自动驾驶
荷载预压加固吹填土时效性研究
浅谈如何提高兽医防控的时效性
基于数据流聚类的多目标跟踪算法
当下新闻编辑时效性分析
北医三院 数据流疏通就诊量
世界经济趋势