和声搜索算法优化支持向量机的网络流量预测

2017-05-03 11:10丁春莉李林森
微型电脑应用 2017年1期
关键词:网络流量搜索算法向量

丁春莉, 李林森

(陕西交通职业技术学院,西安 710021)

和声搜索算法优化支持向量机的网络流量预测

丁春莉, 李林森

(陕西交通职业技术学院,西安 710021)

网络流量受到外界因素作用,具有复杂的变化规律,为了改善了网络流量的预测效果,设计了和声搜索算法优化支持向量机的网络流量预测模型(HS-SVM)。首先对当前网络流量预测研究现状进行深入分析,并指出了网络流量的混沌特性,然后采用混沌理论的相应方法确定网络流量的延迟时间和嵌入维数,并对原始网络流量数据进行重构,最后采用HS-SVM建立网络流量预测模型,并与当前其它网络流量预测模型进行了对照模拟测试。HS-SVM能够挖掘和分析网络流量的变化规律,网络流量预测结果要明显优于其它网络流量预测模型,测试结果验证了HS-SVM的可行性和优越性。

互联网; 网络流量; 混沌理论; 和声搜索算法; 参数选择

0 引言

近些年来,随着计算机技术、信息技术、网络技术的不断发展,网络的应用范围越来越广,每天在互联网上传输数据的种类和数量急剧增加,网络拥塞呈上升趋势,尤其是上网高峰时间,网络拥塞十分严重[1,2]。为了保证网络正常工作,网络管理员提出了许多措施,其中流量预测可以提前知道网络将来的状态,能够提前制定防止网络拥塞的措施,降低网络拥塞的概率,保证网络流的正常工作,因此流量的建模与预测引起了网络公司、管理管理人员的高度重视[3]。

为了解决网络流量的拥塞,人们采用各种方法对其进行分析,出现了许多性能良好的网络流量预测模型。起初人们采用的预测模型主要有:线性回归法、灰色理论、专家系统等[4,5],它们对于结构简单的网络,可以获得较好的网络流量预测结果,但它们需要事先知道网络系统的先验知识,而且认为网络流量一直增长的,固定不变,这与现代复杂网络,尤其是互联网流量变化规律不符合,有时预测结果不可信,不能应用现代网络流量管理中[6]。随着网络流量预测研究的不断深入,人们发现网络流量具有明显周期性,也存在随机性,甚至混沌性,为此人们采用神经网络、极限学习机、贝叶斯网络以及支持向量机(support vector machine,SVM)对网络流量的将来变化态势进行分析,取获了比线性回归等更优的网络流量预测结果[7,8]。网络流量的变化十分复杂,神经网络、极限学习机、要求收集大量的原始流量数据,当流量数据少时,网络流量预测效果下降,应用范围变小;贝叶斯网络虽然可以获得较好的网络流最预测结果,但建模过程复杂,通用性差;相对于神经网络等,SVM的要求样本更少,建模过程更加简单,成为当前网络流量主要建模方法。SVM的网络流量预测效果与核函数及参数选择相关,当前采用随机搜索算法如遗传算法、粒子群算法等解决参数选择问题,然而这些算法有各自的缺陷,网络流量预测结果有待改善[9]。

为了改善了网络流量的预测效果,提出和声搜索算法优化支持向量机的网络流量预测模型(HS-SVM)。首先根据网络流量的混沌特性确定网络流量的延迟时间和嵌入维数,然后采用HS-SVM建立网络流量预测模型,最后与其它网络流量预测模型进行了对照实验,结果表明,HS-SVM网络流量预测结果明显优于其它网络流量预测模型。

1 支持向量机与和声搜索算法

1.1 支持向量机

支持向量机是一种非线性分类和回归算法,形式相当灵活,对于小样本分类或者回归问题,均可以获得较好的结果,设样本为:{(xi,yi),i=1,2,…,n}。由于网络流量预测是一个回归问题,因此采用支持向机的回归[10],如式(1)。

(1)

式中,w表示权向量,b表示偏置向量[12]。

通常情况下,不是直接对(1)进行求解确定参数w和b,而对将其进行适当变换,成为凸二次规划问题,然后进行求解,即有式 (2)。

(2)

式中,C表示预测误差的惩罚参数;Remp(f)为预测结果的损失函数。

为了进一步简化回归的过程,提高支持向量机的工作效率,采用松弛因子对式(2)进行变换,得到相应的目标函数,为式(3)。

(3)

(4)

当一个回归问题不是线性变化,而是非线性变化时,采用式(1)只能建立线性的回归模型,而网络流量具有典型的随机性,因此需要采用映射函数φ将对网络流数据映射到线性空间,把非线性问题变为线性问题进行预测,得到式(5)。

(5)

式(5)的约束条件,为式(6)。

(6)

支持向量机采用核函数k(xi,x)代替(φ(xi),φ(xj))减少支持向量的数量,降低计算时间复杂度,得到式(7)。

(7)

支持向量机的网络流量预测函数,具体如式(8)。

(8)

本文选择RBF核函数,其定义,为式(8)。

(9)

式中,σ为RBF的宽度。

1.2 HS算法

和声搜索(HS)算法是一种模拟乐队调音的随机搜索算法,通过不断调音操作找到最完美和声,即问题的最优解,其工作思想为:设初始解的数量为HM,随机初始化并保存到和声记忆库中,对每一个解以HMCR概率在和声记忆库内搜索,其它在记忆库外进行搜索,将它们合并在一起,得到问题的新解,根据相应规则到记忆库的最差解进行更新,直到满足结束为止[11]。HS算法的工作步骤具体如下:

(1) 初始HS算法的一些参数,如:HMCR、和声记忆库数量(HMS)、音调调节范围和调节率BW和PAR。

(3) 根据相应问题的目标函数得到解的适应度函数值。

(5) 重新计算解的适应度函数值fit(X′),并与历史最优解进行比较,如果更优,就更新最优解的值。

(6) 如果满足算法结束条件,则输入最优解的值。

2 基于HS-SVM的网络流量建模步骤

对一个网络系统,采用流量采集设备得到历史数据为:{xi,i=1,2,…,n},那么i+1时刻的网络流量的预测模型,为式(10)。

(10)

式中,f(·)表示回归函数。

为了更好的捕捉网络流量变化特点,本文采用支持向量机作为拟合函数,则需要支持向量机的参数进行优化,采用和声搜索算法选择支持向量机的参数,网络流量预测目标使预测误差最小,从而得到目标函数,为式(11)。

(11)

基于HS-SVM的网络流量建模过程具体如下:

(1) 初始化支持向量机参数,以及确定参数的范围。

(2) 对网络流量值进行归一化预处理,即有式(12)。

(14)

式中,ymax和ymin分别为最大和最小值。

(3) 针对网络流量的混沌性和随机性,估计最优延迟时间和嵌入维数,并对网络流量原始数据进行重组。

(4) 采用支持向量机对训练样本进行学习,并采用10折交叉验证计算参数组合的适应度函数值,并通过HS算法不断搜索参数,找到最合理参数,构建立HS-SVM流量预测模型。

(5) 采用验证样本对HS-SVM可行性进行测试,并与其它模型进行对比实验,验证HS-SVM的优越性。

3 仿真分析

3.1 源数据

为了测试HS-SVM的可行性,选择一个大型网络公司的网络流量作为研究对象,得到720数据,最后200个数据作为验证样本,分析HS-SVM的泛化性能,其它数据用于HS对支持向量机的参数优化,网络流量数据,如图1所示。

图1 网络流量数据

从图1可以发现,该网络流量数据具有一定的随机,且混沌特征比较明显,因此,通过混沌理论对图1网络流量数据进行延迟时间和嵌入维估计,结果如图2所示。

(a) 延迟时间变化

(b) 嵌入维数变化

对图2进行分析,可以发现该网络流量的最延迟时间和嵌入维数分别为6和4,根据该值对图1数据进行重组。

3.2 结果与分析

根据重组的流量数据对支持向量机进行训练,采用HS算法估计最优参数,得到验证集的预测结果,如图3所示。

(a) 预测结果

(b) 预测偏差

HS-SVM的网络流量预测精度相当的高,实际值和预测几乎完全重合,同时对预测偏差者分析可以知道,预测偏差小,值变化幅度小,说明HS-SVM的网络流量预测误差小。

采用文献[12]和文献[13]的网络流量预测模型进行对照实验,支持向量机的参数如表1所示。所有模型的流量预测精度见表1。

表1 模型参数以及预测精度

相对于文献[12]和文献[13]的网络流量预测模型,HS-SVM的平均预测精度大约提高了4%,对比结果表明HS算法可以确定更优的支持向量机参数,获得了更优的网络流量预测效果型。

4 总结

网络流量受到外界因素的作用,具有复杂的变化规律,针对网络流量的复杂性,提出了HS-SVM的网络流量预测模型,在分析络流量预测研究现状的基础上,建立网络流量预测目标函数,然后根据网络流量的延迟时间和嵌入维数重构网络流量数据,最后HS-SVM建立网络流量预测模型,测试结果表明,HS-SVM能够挖掘和分析网络流量的变化规律,获得了比其它网络流量预测模型更高的预测精度,预测结果可以为企业和管理员提供有用信息。

[1] 张宾,杨家海,吴建平. Internet 流量模型分析与评述[J]. 软件学报, 2011, 22(1):115-131

[2] 邱婧,夏靖波,吴吉祥. 网络流量预测模型研究进展[J]. 计算机工程与设计, 2012. 33(3): 865-869

[3] 邹柏贤,刘强. 基于ARMA模型的网络流量预测[J]. 计算机研究与发展, 2002, 39(12): 1645-1651.

[4] 姚萌,刘渊,周刚. 小波与神经网络相结合的网络流量预测模型[J]. 计算机工程与设计, 2007, 28(21): 5135-5137.

[5] 赵振江. 基于PSO-BP神经网络的网络流量预测与研究[J]. 计算机应用与软件, 2009, 26(1): 218-221.

[6] 党小超,郝占军. 基于改进Elman神经网络的网络流量预测[J]. 计算机应用, 2010, 30(10): 2648-2652.

[7] 高波,张钦宇,梁永生. 基于 EMD及ARMA的自相似网络流量预测[J]. 通信学报, 2011, 32(4); 47-56.

[8] 姚奇富,李翠风,马华林,张森. 灰色系统理论和马尔柯夫链相结合的网络流量预测方法[J]. 浙江大学学报(理学版), 2007, 34(4):396-400.

[9] 李捷,候秀红,韩志杰.基于卡尔曼滤波和小波的网络流量预测算法研究[J].电子与信息学报,2007,29(3):725-725.

[10] 张浩然, 韩正之. 回归支持向量机的改进序列最小优化学习算法[J]. 软件学报, 2003, 14(12): 2006-2013.

[11] Mahdavi M, Fesanghary M, Damangir E. An improved harmony search algorithm for solving optimization problems [J]. Applied Mathematics and Computation , 2007: 188:567-1579.

[12] 张颖璐. 基于遗传算法优化支持向量机的网络流量预测[J]. 计算机科学, 2008, 35(5): 177-180.

[13] 罗赟骞,夏靖波,王涣彬. 混沌-支持向量机回归在流量预测中的应用研究[J]. 计算机科学, 2009, 6(7): 244-246.

Network traffic predicting based on SVM optimized by harmony search algorithm

Ding Chunli,Li Linsen

(Shaanxi College of Communication Technology,Xi’an 710021,China)

Network flow is influenced by some external factors, and has complicated variation law. In order to improve prediction effect of network traffic, this paper puts forward a novel network traffic prediction model based on HS-SVM. First of all, current research status of network traffic prediction is analyzed deeply, and chaotic characteristics of network traffic are pointed out; Then, delay time and embedding dimension are determined by chaos theory to reconstruct original network traffic data; Finally, network traffic prediction model is established by HS-SVM and the simulation test is carried out compared with other network traffic prediction models. HS-SVM can mine and analyze the change law of network traffic, prediction results are better than that of other prediction models, and the test results verify feasibility and superiority of HS-SVM.

The Internet; Network traffic; Chaos theory; Harmony search algorithm; Parameter selection

丁春莉(1963-),女,陕西省临潼县人,副教授,研究方向:计算机软件及应用,西安 710021 李林森(1990-),男,西安,助教,硕士研究生,研究方向:计算机软件开发应用,西安 710021

1007-757X(2017)01-0067-04

TP391

A

2016.06.30)

猜你喜欢
网络流量搜索算法向量
基于多元高斯分布的网络流量异常识别方法
一种基于分层前探回溯搜索算法的合环回路拓扑分析方法
向量的分解
改进的非结构化对等网络动态搜索算法
基于神经网络的P2P流量识别方法
改进的和声搜索算法求解凸二次规划及线性规划
聚焦“向量与三角”创新题
AVB网络流量整形帧模型端到端延迟计算
向量垂直在解析几何中的应用
向量五种“变身” 玩转圆锥曲线