基于单分类支持向量机的潜油电泵工况及故障诊断

2021-11-12 08:49刘广孚杜玉龙石二勇鄢志丹
关键词:电泵斜率工况

刘广孚, 杜玉龙, 郭 亮, 石二勇, 王 震, 鄢志丹

(1.中国石油大学(华东)控制科学与工程学院,山东青岛 266580; 2.中国石油大学(华东)海洋与空间信息学院, 山东青岛 266580; 3.中国石化胜利油田分公司河口采油厂,山东东营 257200)

超过90%的生产油井需要某种形式的人工举升来进行油气开采[1]。潜油电机和电动潜油离心泵组成的潜油电泵机组因为其显著优点广泛应用于高产井、含水井及斜井中,是各油田重要的采油设备[2]。但是由于潜油电泵机组结构复杂,关联性强,再加上复杂多变的地质结构和井况条件,导致潜油电泵机组的故障率较高[3],且故障类型复杂多样。一直以来,国内外对于潜油电泵机组的故障或工况诊断研究从未间断过[4]。潜油电机是一种三相异步电动机,在电网电压一定时,其电磁转矩与电机电流具有特定的非线性关系,即电机电流的变化可以反映负载转矩的变化。所以,传统的工况诊断方法主要为电流卡片[5-8],但电流卡片记录的信息量有限,且时效性较低,逐渐被油田淘汰。在“数字化”油田时代,国内外学者针对潜油电泵机组不同类型的故障或工况,分析其对应的相关参数数据,实现对故障及工况的识别。Li等[9]通过分析9种不同工况下气体产量、液体产量、油气比、电压、电流和油压参数的变化情况,区别不同类型的工况或故障。Gupta[10]提出了一种数据驱动的分析解决方案,使用多变量统计方法来主动监控与潜油电泵性能相关的寿命统计数据,通过降维和模式识别实现对故障的预警和诊断。上述两种方法是建立在统计数据的基础上的,但实际生产中故障数据缺乏,在实际应用中受到一定的限制。国内各大油田也在积极开展潜油电泵机组异常工况分析,力求降低故障率[11-12],但更多的是基于现场处置经验,数据的科学性不足。潜油电泵机组运行状态监测及故障预警对油田生产具有重要的意义。但由于油田数字化建设时间较短,而且正常运行数据量远高于故障数据量,并且潜油电泵工况及故障类型复杂多样,所收集的不同故障类型的样本数据难以达到深度学习训练及验证的要求。笔者仅依托潜油电泵井正常运行数据建立单分类支持向量机模型,通过对电流数据进行清洗、筛选、分析及特征提取,训练单分类支持向量机模型获得区分潜油电泵井正常运行状态和异常运行状态的能力,实现对潜油电泵井异常工况的判别及预警。

1 单分类支持向量机

支持向量机(support vector machine, SVM)[13-14]是针对二分类问题提出的,需要用两种数量相对均衡的样本建立训练数据集。但是在工业生产中,面临一个较为普遍的问题,即正常状态数据多,异常状态数据少,甚至没有数据样本,对工业故障诊断造成一定困扰。当遇到只有一种类型的数据即单分类问题时,SVM演变出了基于单分类的支持向量机[15-17]。单分类支持向量机(one-class support vector machine, OCSVM)是基于支持向量机的一种单类分类算法[18],与传统支持向量机思想类似,将数据映射到与内核相对应的特征空间,在特征空间中求解最优超平面(图1),最大化样本与原点之间的间隔[19]。

图1 单分类支持向量机的最优超平面Fig.1 Optimal hyperplane of one-class support vector machine

(1)

利用对偶算法的思想,求得上述问题的最优解。对于式(1),构造上述模型的拉格朗日方程,得到原优化问题的对偶问题:

(2)

其中

Qij=K(xi,xj)=φ(xi)φ(xj).

式中,K(xi,xj)为核函数。普遍使用的核函数是高斯径向基核函数(radial basis function,RBF),其函数表达式[21-22]为

(3)

式中,σ为核宽度系数。由式(2)求解出α,得到决策函数为

(4)

2 潜油电泵工况及故障诊断模型

2.1 整体思路

针对电泵井实际生产中所面临的正常状态数据多、异常状态数据少而无法完成模型训练及验证的问题,本文中将单分类支持向量机模型引入到潜油电泵工况及故障诊断中,利用单分类支持向量机的特殊优势,仅依靠潜油电泵在正常状态下的电流数据就可以识别异常状态,实现对潜油电泵故障及异常工况的精准识别。

图2 潜油电泵工况及故障诊断流程Fig.2 Operating condition and fault diagnosis flow chart of electric submersible pump

2.2 数据准备

本文中所有数据均采集于中国石化胜利油田下属某采油厂,该采油厂信息化程度较高,生产指挥系统平台可实时获取潜油电泵机组的三相电压、三相电流、油压、井口温度、瞬时流量等工作参数及环境参数,采集间隔为1 min。选取50口电泵井(1~50号电泵井)在正常状态下的三相历史电流数据构建训练集,每口井选择106min的三相电流数据,并且将每500 min的三相时序电流数据划分为3个数据样本,即A相、B相、C相分别构成一个样本。A相电流选取2 000个训练样本,B相电流选取2 000个训练样本,C相电流选取2 000个训练样本,每口井共选取6 000个训练样本,故训练集中共包含3×105个样本。另外选择2口含故障数据的潜油电泵井(51号和52号电泵井),将其故障期间的A相电流数据作为测试集,每口井选取2 500 min的A相电流数据,以500 min为时间窗口、1 min为滑动步长划分测试样本,每口井选取2 000个测试样本。图3为训练样本中4口不同电泵井在正常状态下的运行电流数据样本。从图中可以看出,此时运行电流平稳,波动幅度小。

2.3 模型搭建

利用OCSVM模型构建潜油电泵工况及故障诊断模型,通过学习正常状态数据样本,获得区分异常样本的能力。构建工况及故障诊断模型主要包括3部分。

2.3.1 特征提取

首先对潜油电泵井正常状态下的电流数据进行特征提取,假设其中某一正常状态下的时序电流数据为L={l1,l2,l3,…,lt},其中本文中t取500。提取以下6个特征值,构建特征集。

(1)t分钟内的波动幅度(A)为

A=maxL-minL.

(5)

(2)t分钟内的变化斜率(G)为

(6)

(3)标准差(S)为

(7)

(4)最大值和最小值的差值占均值的百分比(D)为

(8)

(5)两点间正、负斜率样本数各占总样本的比例。假设电流数据L中每两点间的斜率集合为M={m1,m2,m3,…,mt-1},统计M中正斜率样本数(mi>0.1)和负斜率样本数(mi<-0.1)各占斜率样本总数的比例,以此表现电流数据的波动性。以下面两段电流数据样本为例,正常工况下相邻两点电流间正、负斜率样本数各占斜率样本4%(图4);而气干扰工况下两者的比例分别为47.29%、49.5%(图5)。因此该特征可以很好地表现电流数据的波动性。

为了提高模型精度和收敛速度,在将数据样本送入网络之前,需要对数据进行归一化处理,将数据映射到[0,1]之间。

图3 不同电泵井正常状态下三相电流数据样本Fig.3 Three-phase current data samples of different electric pump wells under normal conditions

图4 正常工况下相邻两点电流间斜率分布Fig.4 Distribution of slope of two adjacent current values under normal conditions

2.3.2 建立OVSVM模型

选取高斯径向基核函数建立OCSVM分类模型,其误差惩罚系数设置为0.1。利用提取的特征值进行模型的训练及优化,保存最优模型。最后,将潜油电泵机组测试数据样本提取相应特征值后,输入OCSVM模型中进行正常状态和异常状态的判断。通过利用OCSVM模型,可以准确识别异常状态数据,也包括未知的异常状态类型。

图5 气干扰工况下相邻两点电流间斜率分布Fig.5 Distribution of slope of two adjacent current values under interference conditions

2.3.3 模型评估

为了更好地评估模型的分类效果,采用精确率(P)和召回率(R)两个分类指标。其定义为

(9)

(10)

式中,NTP为正类数据被识别为正类的样本数;NFP为正类数据被识别为负类的样本数;NFN为负类数据被识别为正类的样本数。

3 试验验证及分析

利用OCSVM模型对另外50口潜油电泵井(51~100号电泵井)近两年的运行状态进行了判别,并进行了结果验证。针对不同运行状态,本文中选取了其中较典型的2口潜油电泵井分别进行详细分析。结果表明,故障识别准确度较高,误差较低。

以51号潜油电泵井为例,该井在2019年12月19日4时8分因为异物卡泵造成潜油电泵机组负载增大,11时49分过载停机,选择该井数据进行运行状态识别及验证试验,运行电流如图6(a)所示。将图6(a)测试数据以500 min为时间窗口进行数据划分及特征提取,输入模型中进行状态识别。在4时10分,潜油电泵井电流上升幅度达到4.7 A,斜率为0.008 8,标准差为25.16, 最大值和最小值的差值占均值的百分比为17.9%,超出正常状态范围,OCSVM模型判别此时潜油电泵井进入异常状态;并且故障发生后,电流两点间正、负斜率样本数各占总样本的比例分别从20%、21%变为42%、48%,更加确定潜油电泵井运行状态异常。但按照之前的阈值报警模式,该状况并不会触发预警系统或停机动作,导致潜油电泵井故障运行,从而造成机组损坏严重。通过此模型,可以在第一时间监测到潜油电泵井的异常状态,提前采取停井作业等措施可以降低机组的损坏程度,降低维修成本,实现故障预警功能。

图6 51号潜油电泵井运行电流及识别结果Fig.6 Operating current and identification results of No.51 electric submersible pump well

以52号潜油电泵井为例,该井在2019年6月29日7时2分因负载增大造成电流增大,6月30日0时48分潜油电泵过载停机且泵轴断裂,故障停机前期的运行电流如图7(a)所示,选取其为测试样本。从电流数据变化中可以看出,在泵轴断裂前期,有比较明显的故障特征,长达1 000 min,如果能够及时监测到异常状态,可以避免发生泵轴断等严重损坏设备的现象。

在6月29日7时10分,电流上升幅度达到1.3 A,斜率从0增大为0.001 2,标准差从0变为5,并持续增大,D从0变为2.5%,故障发生后电流两点间正、负斜率样本数各占总样本的比例分别从0变为30%、29%,所以认为潜油电泵井进入异常运行状态。由图7(b)可以看出,OCSVM模型可以比较精准地识别异常状态,从而发出预警信息,避免潜油电泵在故障下持续运行,可以提前采取停井检修等措施,避免泵轴发生断裂。

图7 52号潜油电泵井运行电流及识别结果Fig.7 Operating current and identification results of No.52 electric submersible pump well

表1 51号和52号潜油电泵井识别准确度

4 结束语

提出利用OCSVM模型代替原有的阈值报警模式,通过借助大量正常数据样本区分多样化的异常数据,其中也包括未知的故障类型,提升了针对异常数据的识别能力,解决了油田生产中故障样本少难以实现故障精准识别的问题,对油田生产具有一定的实际应用意义。利用OCSVM模型对潜油电泵井近两年的电流数据进行了测试和验证,通过试验证明,判别准确度比较高,误差在可控范围内,泛化能力强,可以实现精准报警。通过提前采取预防措施,可以避免更严重故障的发生。同时,针对工业故障诊断中异常状态数据缺乏的问题提供了理论思路。

猜你喜欢
电泵斜率工况
变频器应用于潜油电泵井的节能探讨
热网异常工况的辨识
变工况下离心泵性能研究
一种适用于大井斜的潜油电泵井单流阀
不同工况下喷水推进泵内流性能研究
脉冲工况氧气缓冲罐裂纹修复实践
高温高压屏蔽式电泵螺栓计算优化分析
物理图像斜率的变化探讨
火电机组公用电泵系统介绍及逻辑设计
求斜率型分式的取值范围