一种基于半监督流形学习的抽油机故障诊断方法

2017-06-26 12:49赵万平
计算机与数字工程 2017年6期
关键词:示功图流形高维

赵万平

(东北石油大学计算机与信息技术学院大庆163318)

一种基于半监督流形学习的抽油机故障诊断方法

赵万平

(东北石油大学计算机与信息技术学院大庆163318)

针对油田实际生产中示功图已知识别样本匮乏的情况,提出一种基于半监督流形学习的识别方法,利用标识和未标识的样本数据通过流形学习算法对采集的样本数据进行特征提取获得低维特征空间,并在低维特征空间进行故障模式分类以达到故障诊断的目的,取得了很好的实际应用效果。

示功图;半监督;流形学习;识别

Class NumberTP391

1 引言

在油田开发过程中随着地层能量的不断消耗,自喷开采技术已不能满足油田开发的需求,故多数油田已采用有杆泵采油技术。而工作在地下几百米到数千米的抽油泵不但受到机、杆、泵等设备的影响,还受砂、蜡、气、水的影响,工况复杂且环境恶劣,出现故障的情况复杂多样,因此严重影响了油田的生产。如何正确识别各种故障类型有利于有针对性的制定各种油井调整方案,提高油井的采收率。经过多年的研究,抽油井故障的分析与诊断技术积累了很多的研究成果[1],其中多数是利用示功图作为分析油井各种工况的出发点,多数都是基于示功图本身的特征识别(面积法和矢量法等)[2~3],或利用神经网络[4]或是支持向量机[5]等根据从图形中提取的特征向量进行判别。其中便涉及到数据降维问题,且为了获取更高的识别率需要大量的学习样本。而抽油机采油过程中产生的故障数据中准确标记样本较少,大都是没有标记的故障数据,半监督学习可以利用少量的故障标记数据训练识别器,并利用大量的非标记故障数据来提升识别器的性能和精确性。本文提出一种基于半监督流形学习的示功图识别方法,在部分有标签信息的示功图数据的情况下,通过利用示功图本身的非线性流形结构信息和部分标签信息来提取低维鉴别特征用于示功图识别。

2 示功图原理

抽油机在采油过程中做上下往复运动,将从一个下底端向上至上顶端,再由上顶端向下回到下底端的过程称为一个冲程。对于一个冲程,将抽油机相对下底端的位移S作为横轴,抽油机向上的拉力F作为纵轴绘制关于F,S的闭合曲线定义为示功图。实际油井生产过程中,由于油田各种生产环境的特殊性将会导致抽油设备发生阻尼运动,所以油井实测的示功图会有一定程度的变形但仍呈现对称性,如图1所示。

图1 采油井示功图

3 半监督流形学习原理

复杂多变的工作环境中可能会给同一故障类型的示功图带来很多非线性变形,致使传统的降维方法如PCA等不能够揭示图形空间的内蕴结构,使得传统识别方法的性能可能会下降很多。流形学习理论作为数据降维和特征提取的重要方法却能很好的解决这样的问题。从拓扑学的角度看,流形是嵌入于高维空间中的低维数据集[6],流形学习的目地就是从高维数据集中获得其低维描述,即寻找高维数据集的内在特征进而实现特征提取。经典的非线性流形学习算法包括等距映射(Isomap)[7],拉普拉斯特征映射(Laplacian eigenmaps,LE)[8],局部线性嵌入(Locally-linear embedding,LLE)[9],其中LLE算法具有每个点的近邻权重在平移、旋转、及缩放下保持不变,算法有解析的整体解,不需要迭代运算、计算复杂度相对较小且易执行的优点。

3.1 流形学习算法原理[10]

局部线性嵌入算法假定各点数据的局部区域为近似平面,故所有数据样本都可以利用其线性组合各自邻域内的样本数据来逼近。对于样本中的各点xi和它的邻域{xi,j∈Ji},通过最小化式(1)的值来求解出重构权值ωji(表示xj重构xi的权重):

其中求解ωji需要遵循以下规则:1)如果xj不属于xi的邻域,则ωji=0;2)对于所有的i,将这些权重组成稀疏矩阵W,体现出各数据点xi和它的邻点间的局部特性,由此也表明通过式(1)求得的权重能够发掘数据样本及其邻域之间的几何特性。因为规则,则式(1)可以改写为根据Lagrange乘子法,则求解式(2)的最优解应满足如下条件:GiTGiwi-λI=0,ITωi=0,当Gi列满秩时,利用式(3)来求解重构权重:

局部线性嵌入算法通过求解正则化的线性系统(Gi

TGi+γ‖‖Gi2I)yi=I来求解ωi=yi/ITyi。

低维嵌入τi∈Rd要表现出高维数据样本空间中的重构关系,则最小化式(4):

其中T[τ1,τ2,…,τN],为保证式(4)求解结果的唯一性,则T满足以下两个约束:1)T为标准正交矩阵,即TTT=I;2)中心化T,即TIN=0。则式(4)可以改写成:E(T)=Tr(T(I=W)T(I-W))。通过求解ϕ=(I-W)T(I-W)的最小d+1个特征向量u1,u2,…,ud+1便可得到高维样本数据的低维嵌入T=[u1,u2,…,ud+1]T。

3.2 流形学习算法流程

1)选取数据点的邻域

求取高维数据样本中xi的邻域,k=|Ji|表示xi的邻域个体数,Ji代表xi邻域结点下标集。

2)求解重构权重

对于每个数据点,令Gi=[…,xi-xj,…]j∈J,再

i求解(Gi+γ‖GiI)yi=Ik,初始化权重矩阵W=0,再设W(Ji,i)=ωi,i=1,…,N,求得W。

3)求解高维数据空间的d维嵌入数据

求解ϕ=(I-W)T(I-W)的d+1个最小的特征向量u1,u2,…,ud+1,进而获得高维数据的低维嵌入T=[u1,u2,…,ud+1]T。

3.3 半监督局部线性嵌入算法

给定示功图数据集X={(x1,c1),(x2,c2),…,(xl,cl),xl+1,xl+2,…,xl+u}∈Rn×m,包含l个标记样本和u个无标记样本,ci是xi的故障类别标记,Y∈Rn×m,Y为嵌入于高维空间的流形,d≤m。半监督局部线性嵌入算法具体步骤如下:

1)求Xi的K个近邻域,定义距离公式是数据点Xi和Xj间的欧式距离,M(i)是Xi和Xj的平均距离。

2)改进距离度量公式:

β为控制参数,α为调整参数

3)按照上面公式重新计算Xi的K个近邻域,计算重构权Wij。求Xi重构误差的最小值,得到最优的重构权。

图2 示功图样本数据

4)根据上述3.2节的流形学习算法求解低维嵌入Y,通过重构权重保留高维数据的局部几何特征。

3.4 示功图识别步骤

1)通过远程采集设备将示功图数据传递到识别器并进行图像预处理;

2)采用半监督局部线性嵌入算法对待识别的示功图数据利用流形算法把原有的高维数据集映射到低维特征空间;

3)利用KNN分类器对特征空间的样本进行模式分类进而识别示功图类型。

4 故障类型识别仿真

常见的抽油机故障类型主要有抽油杆断脱、油井结蜡、供液不足、固定凡尔漏失、稠油、游动凡尔漏失、油井出砂、泵上碰、活塞遇卡、泵下碰和气锁等,下面给出其中6种故障类型的示功图,如图2所示。

考虑到LLE仅保持样本局部特征而不计算任意两数据点的测地线距离,因此反映局部特征的K值对LLE影响更为显著。均匀设计是一种试验设计方法,它舍弃了正交设计的整齐可比性,只考虑试验点的均匀分布,能用较少的试验点获得最好的均匀性[11~12],通过均匀设计设计K=6。总共对80口井,每口井8张示功图共640张示功图,共包含12种故障类型进行识别,并对比BP神经网络和支持向量机的判别结果如表1所示。

表1 判别结果对比

在数据样本选择中,人为地增加了一些额外的故障样本,由于BP神经网络和支持向量机这种识别模型需先学习后再识别,通过实验可以看出这两个模型对于未训练过的样本识别效果不是很理想,而本文的半监督流形学习则是充分利用示功图数据本身的结构信息和已知的样本标签,使得具有相同标签样本信息的样本之间的距离最小化,不同类别样本数据之间的距离最大化,进而有效地提取高维样本数据的低维特征流形来提升识别性能。

5 结语

针对目前机械采油设备工作环境复杂多变,多数故障类型难以识别的情况,本文提出一种基于半监督流形学习的识别方法,该方法计算量小且无需事先学习,可以通过流形学习算法对高维数据进行约减,提前低维特征数据,再通过已知的标签样本数据指导分类,有效地解决了在缺少样本数据的情况下对未知数据进行分类,在实际应用中取得了很好的识别效果。

[1]黄鹂,凌建军.有杆泵抽油井故障诊断智能系统进展[J].石油钻探技术,1995,23(2):64-66.

HUANG Li,LING Jianjun.Advances in fault dianosis intelligence system for sucker-rod pumping wells[J].Petroleum Drilling Techniques,1995,23(2):64-66.

[2]李正勤,黎洪生.基于示功图面积变化的抽油机故障诊断模型[J].油气田地面工程,2008,27(9):3-4.

LI Zhengqin,LI Hongsheng.Fault diagnosis model of oil pumping unit based on area variation of indicator diagram[J].Oil-Gasfield Surface Engineering,2008,27(9):3-4.

[3]王洪岩,乔磊,樊瑞筱.基于不变矩的示功图故障诊断方法研究[J].科学技术与工程,2012,12(17):4308-4310.

WANG Hongyan,QIAO Lei,FAN Ruixiao.Fault diagnosis method research based on invariant moment of indicator diagram[J].Science Technology and Engineering,2012,12(17):4308-4310.

[4]吴伟,陈国定,何焱.基于人工神经网络和灰度矩阵的泵功图诊断[J].西安石油大学学报(自然科学版),2007,22(3):119-121.

WU Wei,CHEN Guoding,HE Yan.Fault diagnosis system for pump work indicating diagram based on neural network and gray-level matrix[J].Journal of Xi'an Shiyou University(Natural Science Edition),2007,22(3):119-121.

[5]朱春梅,陕梅辰,智玉杰,等.支持向量机的无杆抽油机示功图自动识别技术[J].北京信息科技大学学报(自然科学版),2014,29(1):16-20.

ZHU Chunmei,SHAN Meichen,ZHI Yujie,et al.Study on automatic recognition of indicator diagram of rod-less pumping unit based on support vector machine[J].Journal of Beijing Information Science&Technology University,2014,29(1):16-20.

[6]宋涛,汤宝平,李锋.基于流形学习和K-最近邻分类器的旋转机械故障诊断方法[J].振动与冲击,2013,32(5):149-153.

SONG Tao,TANG Baoping,LI Feng.Fault diagnosis method for rotating machinery based on manifold learning and K-nearest neighbor classifier[J].Journal of Vibration and Shock,2013,32(5):149-153.

[7]Roweis S T,Saul L K.Nonlinear dimensionality reduction by Locally Linear Embedding[J].Science,2000,290(5500):2323-2326.

[8]Belkin M,Niyogi P.Laplacian Eigenmaps and spectral techniques for embedding and clustering[C]//Advances in Neural Information Processing Systems.Cambridge,MA,USA:The MIT Press,2002,14:585-591.

[9]Tenenbaum J B,Silva V D,Langford J C.A global geometric framework for nonlinear dimensionality reduction[J]. Science,2000,290(5500):2319-2323.

[10]王自强,钱旭,孔敏.流形学习算法综述[J].计算机工程与应用,2008,44(35):9-12.

WANG Ziqiang,QIAN Xu,KONG Min.Survey on manifold learning algorithms[J].Computer Engineering and Applications,2008,44(35):9-12.

[11]王元,方开泰.均匀分布与试验设计(数论方法)[J].科学通报,1981,26(2):65-70.

WANG Yuan,FANG Kaitai.Uniform distribution and experimental design(number theoretic method)[J].Chinese Science Bulletin,1981,26(2):65-70.

[12]梁昌勇,陆青,张恩桥,等.基于均匀设计的多智能体遗传算法研究[J].系统工程学报,2009,24(1):109-113.

LIANG Changyong,LU Qing,ZHANG Enqiao.Research on multi-agent genetic algorithm based on uniform design[J].Ournalof Systems Engineering,2009,24(1):109-113.

Pumping Unit Fault Diagnosis Method Based on Semi-supervised Manifold Learning

ZHAO Wanping
(School of Computer and Information Technology,Northeast Petroleum University,Daqing163318)

According to indicator diagram of known samples in actual production of oil is deficient,A semi supervised recognition method based on manifold learning is proposed.Low-dimensional feature space can be obtained using manifold learning algorithm by labeled and unlabeled sample data to the data collected for feature extraction.It can achieve the purpose of fault diagnosis in the low-dimensional feature space for fault pattern classification,and achieve good effect in practical application.

indicator diagram,semi-supervised,manifold learning,distinguish

TP391

10.3969/j.issn.1672-9722.2017.06.003

2016年12月13日,

2017年1月24日

国家自然科学基金项目“基于集成学习的生物医学文本信息抽取方法研究”(编号:61402099)资助。

赵万平,女,副研究员,研究方向:模式识别、智能算法。

猜你喜欢
示功图流形高维
有向图上高维时间序列模型及其在交通网络中的应用
示功图诊断单井液量异常的系统建设分析
浅谈示功图在油田节能监测工作中的应用
基于CNN迁移学习的示功图图形分类预警
局部对称伪黎曼流形中的伪脐类空子流形
基于模式识别技术的油井工况诊断
对乘积开子流形的探讨
高维洲作品欣赏
基于矩阵模型的高维聚类边界模式发现
基于多故障流形的旋转机械故障诊断