基于偏二叉树支持向量机的ERT系统流型识别研究*

2017-01-06 01:50曲海旭
通化师范学院学报 2016年12期
关键词:二叉树流型波包

张 华,曲海旭

(吉林建筑大学城建学院,吉林长春130011)

ZHANG Hua,QU Hai-xu(The City College of Jilin Architectural And Civil Engineering Institute,Changchun,Jilin 130011,China)

基于偏二叉树支持向量机的ERT系统流型识别研究*

张 华,曲海旭

(吉林建筑大学城建学院,吉林长春130011)

两相流在工业中应用广泛,它具有非常复杂的流动性和随机性,准确识别流型是两相流参数准确测量的基础.该文首先用小波包分解方法提取ERT系统测量的压差波动信号特征,然后构建偏二叉树支持向量机多类分类模型,最后向分类模型中输入特征数据进行流型识别.实验结果表明偏二叉树支持向量机多类分类算法较大提高了流型识别的准确度,是一种有效的流型识别方法.

电阻层析成像;流型识别;小波包;偏二叉树支持向量机

广泛存在于工业生产中的两相流具有复杂的流动特性,其参数检测难度很大.流型在影响两相流的流动特性和传热性能的同时还会影响对两相流的测量准确性.因此流型识别是两相流参数检测的一个重要研究方向.本文针对ERT系统和油/水两相流的四种流型,提出一种基于小波包分解和偏二叉树支持向量机的流型识别方法.该方法利用小波包分解提取ERT系统测量的压差波动信号的特征数据,提高了支持向量机的训练和测试效率.并利用偏二叉树支持向量机算法解决了以往一对一和一对多支持向量机算法可能存在的不可分区域问题,提高了流型识别的准确率.

1 ERT系统结构和工作原理

图1 ERT系统组成结构图

ERT系统主要组成部分是电阻传感器阵列、数据采集系统、图像重建计算机[1].系统组成结构如图1所示.ERT系统采用电流激励、电压测量的工作原理,本文针对12电极ERT系统采集到的电导率波动信号进行处理,采用相邻电极的激励模式,一幅图像共采集到12*(12-3)=108个测量数据.ERT系统工作原理图如图2所示.

图2 ERT系统工作原理图

2 特征提取

2.1 小波包分解原理

小波包分解是一种较好的、针对非平稳信号进行特征提取的工具,它为信号提供了一种更加精密的分解方法.它以小波分析为基础,将频带进行多层次划分,进一步分解多分辨率分析没有细分的高频部分,并能依据被分析信号的特征,自动地选择对应的频带,以匹配相应的信号频谱,从而进一步提高时频分辨率[2].

2.2 小波包特征提取过程

①对输入信号S,进行三层小波包分解,其中采用db6小波滤波器和shanon熵值.提取第三层中从低频到高频的8个信号特征[3].

②获得小波包的系数,即幅值,通过公式E3 j=|2计算出各个频段的能量(其中E3 j是信号S3j所对应的能量,Xjk表示重构信号Sij离散点的幅值).

③通过公式T=⌊E3 j/E」 j=0,1,…,7 其中E满足公式:

对第2步所求能量值做归一化处理.

④构造以各频段能量为特征值的特征向量,即T=[E30,E31,E32,E33,E34,E35,E36,E37]T.

3 构造支持向量机多类分类模型

3.1 支持向量机原理

支持向量机基于VC(Vapnik-Chervonenkis)理论[4]和结构风险最小化原理,能兼顾训练错误和泛化性能,是适用于小样本学习的通用学习算法,它为机器学习算法开辟了新天地.

根据支持向量机的定义,非线性最优超平面的构造问题转化为一个二次规划[5]:

训练完成后,计算下列函数的符号:

3.2 建立偏二叉树支持向量机多类分类模型

上述支持向量机原理仅限于解决两类分类问题.而实际应用中通常是多类分类问题[6].常见的多类分类方法有一对一、一对多和二叉树,其中一对一和一对多存在不可分区域.二叉树多类支持向量机首先将所有的类别划分成两个大子类,再将每个大子类进一步划分成两个次级子类,以此类推,直到所有的叶子节点都只包含一个单独的类别.二叉树多类分类方法将原来的多类分类问题分解成了一系列的两类分类问题,而两类分类问题就可以用传统的SVM解决.这种方法为K种类别分类,在训练时只需要构造K-1个SVM两类分类器,在测试时根据实际情况不一定需要计算所有的分类器判断函数,可以大大节省训练和测试的时间.并且可以有效避免一对一和一对多方法中存在不可分区域的情况.

二叉树的拓扑结构分为两种:偏二叉树[7]和完全二叉树,本文选用偏二叉树构造SVM多类分类模型.过程分为两个阶段进行,分别是训练阶段和测试阶段.

训练阶段:针对ERT系统中的四种流型,根据二叉树算法需要训练4-1=3个SVM两类分类器.构造区分1类和2、3、4类的SVM1时,将属于第1类的样本标记为正类,属于第2、3、4类的样本标记为负类,训练SVM1,即构造并求解上文提到的二次规划,得到区分1类和2、3、4类的超平面H1:f(x)1+b.以此类推,依次构造区分2类和3、4类的SVM2,得到超平面 H2:f(x)2=+b,区分3、4类的SVM3,得到超平面H3:

测试阶段步骤如下:

第一步:设给定的训练集为 {(x1,y1),(x2,y2),…,(xl,yl)},l代表用l组样本数据进行训练.其中xi∈Rn,yi∈{1,2,3,4},i=1,2,…,l.

第二步:对于待求样本X,求超平面H1:f1(x) =sgn(g(x)),其中g(x)yiaiK(x,xi)+b的值,若是1,则样本X属于第1类,此次判断结束;若是-1,则样本X属于(2、3、4)类,进入右节点,继续判断.

第三步:重复第二步,直到到达叶子节点,此叶子节点所属的类别就是待分样本X所属的类别.

图3 偏二叉树支持向量机多类分类模型

4 实验过程和识别结果分析

本实验采用MATLAB进行仿真.实验步骤如下:第一步,训练:随机选取已知流型的样本:点滴流180个,核心流225个,层流270个,环状流315个.根据ERT系统工作原理,测量到的每种流型是一个108维向量,经过特征提取降为8维向量.构造多类分类模型过程中,支持向量机算法采用最小二乘法[8],二次规划的核函数采用径向基核函数,选择控制错分样本惩罚程度参数和径向基核函数参数时,采用网格搜索法,找到最佳组合.第二步,测试:随机选取每种流型,其中,点滴流20个,核心流25个,层流30个,环状流35个.先提取样本特征,然后选择各个参数构造多类分类模型,最后将样本输入偏二叉树支持向量机多类模型进行分类.第三步,比较:重复以上训练步和测试步,在以往构造的一对多类、一对一类支持向量机多类模型上进行实验对比.表1显示各种分类模型下的测试精度和训练时间.

表1 实验结果统计分析

5 结论

本文针对ERT系统中的油水两相流流型识别,提出一种基于偏二叉树支持向量机的流型识别方法.构造偏二叉树支持向量机多类分类模型需要的支持向量机数量较少,提高了训练速度,同时偏二叉树策略避免了一对一和一对多策略的不可分区域.经过实验结果对比,在同样使用小波包分解进行特征提取的前提下,偏二叉树支持向量机多类分类模型的识别精度和训练时间要优于一对一模型和一对多模型.

[1]DICKIN F..J.,WANG M.Electrical Resistance Tomography for Process Application.Measurement Science and Technology[J].1996,7 (3):247-260.

[2]ELPERIN T,KLOCHKO M.Flow Regime Identification in a Two -Phase Flow Using Wavelet Transform[J].Springer-Verlag,2002,32: 674-682.

[3]WU M M,DONG F,QI G H.Feature Extraction Method for Gas/ Liquid Two-Phase Flow Based on Wavelets Transform[C].5th International Conference on Machine Learning and Cybernetics,2006:1422-1427.

[4]边肇祺,张学工.模式识别[M].北京:清华大学出版社,2000.

[5]VAPNIK V N.The Nature of Statistical Learning Theory[M].New York:Springer-Verlag,1995.

[6]Guo-hua Qi,Feng Dong,Yan-bin Xu,et al.Gas/Liquid Two -Phase Flow Regime Identification In Horizontal Pipe Using Support Vector Machines[C]//.Proceedings of the Fourth International Conference on Machine Learing and Cybernetics,2005:1746-1751.

[7]谢娟英,张兵权,汪万紫.基于双支持向量机的偏二叉树多类分类算法[J].南京大学学报(自然科学),2011,47(4):354-363.

[8]Zhenrui Peng,Gensuo Mi.Voidage Measurement of Two-Phase Flow Based on Least Squares Support Vector Machine[C]//.Proceeding of the 6th World Congress on Intelligent Control and Automation,2006: 4900-4903.

(责任编辑:王前)

Study on Flow Regime Identification of Electrical Resistance Tomography System Based on Binary Tree Support Vector Machine

Two-phase fluid,which has complex flow characteristic and randomness,has been applied widely in the industrial production.The accurate identification of flow regime is the foundation of accurate measurement on two-phase flow's parameter.Firstly,the feature of differential pressure fluctuation signal,which is measured by electrical resistance tomography system,is extracted by wavelet packet analysis.Then,the multiclass model of binary SVM is constructed.Finally,the data about extracted feature is inputted into the multi-class SVM of binary.The experimental results show that the accuracy of twophase flow regime identification has been improved remarkably.Binary SVM is an effective method for regime identification.

electrical resistance tomography,flow regime identification,wavelet packet,Binary Tree Support vector machine

ZHANG Hua,QU Hai-xu
(The City College of Jilin Architectural And Civil Engineering Institute,Changchun,Jilin 130011,China)

TP391.4

A

1008-7974(2016)06-0063-03

10.13877/j.cnki.cn22-1284.2016.12.020

2016-10-09

张华,女,吉林龙井人,讲师.

猜你喜欢
二叉树流型波包
基于双向二叉树的多级菜单设计及实现
基于故障二叉树的雷达发射机故障诊断*
空调器水平管路内R32流动过程的流型变化规律
基于支持向量机和小波包变换的EOG信号睡眠分期
二叉树创建方法
水平井斜井气液两相流型自动判别
一种基于SVM 的多类文本二叉树分类算法∗
水平管内流动冷凝流型图研究进展
基于小波包变换的乐音时—频综合分析程序的开发
成像流型辨识算法