基于改进支持向量机的运动视频内容分类算法研究

2020-07-23 06:27许淑贤

现代电子技术 2020年4期

许淑贤

摘要：针对现有运动视频内容分类算法中使用支持向量机分类器难以提高分类精度问题，提出基于改进支持向量机的运动视频内容分类算法。首先采用稀疏表示方法进行运动视频内容去噪，在降低噪声的同时去除无用静止信息，将去噪后的运动视频内容进行非重叠切分，采用主成分分析法提取运动视频内容像素点特征描述项并建立特征向量空间;然后引入主动学习机制改进支持向量机分类器，使用改进的分类器建立特征向量空间与运动视频类别之间的联系。针对多类运动视频内容分类问题，提出使用后验概率计算改进的分类器对未标记样本的置信度进行运动视频样本选取。实验结果表明，所提算法与现行分类算法相比，具有更好的类别区分度。

关键词：运动视频; 内容分类; 改进支持向量机; 内容特征提取; 主动学习; 实验分析

中图分类号： TN948.4?34; TP391 文献标识码： A 文章编号： 1004?373X（2020）04?0127?03

Research on motion video content classification algorithm based on

improved support vector machine

XU Shuxian

（Guilin University of Technology， Guilin 541004， China）

Abstract： As the support vector machine classifier is difficult to improve the classification accuracy in the existing motion video content classification algorithm， a motion vector content classification algorithm based on improved support vector machine is proposed. The motion video content is de?noised by means of the sparse representation method， at the same time the unwanted static information is removed. The de?noised motion video content is divided into non?overlapping segments， the feature description items of pixels in the motion video content are extracted by means of the principal component analysis method， and the feature vector space is established. The support vector machine classifier is improved by introducing the active learning mechanism， and the improved classifier is used to establish the relation between the feature vector space and the motion video category. In allusion to the problem of multi?class motion video content classification， an improved classifier based on posterior probability calculation is proposed to select motion video samples with confidence of unlabeled samples. The experimental results show that， in comparison with the current classification algorithm， the proposed algorithm has better class discriminative degree.

Keywords： motion video; content classification; Improved support vector machine; content feature extraction; active learning; experiment analysis

0 引言

在众多领域的运动视频分析中，视频内容分类是研究的关键问题之一，其分类性能的好坏直接影响运动目标分析和移动轨迹跟踪的精度[1]。移动场景中的任何肉眼难以察觉的运动都会体现在视频图像流的变化上，对运动视频内容进行有效分类，就可以分析运动目标的运动特性[2]。运动视频内容分类的首要目的是从运动视频帧中获取有用内容，滤除无用的噪声及静止信息，为接下来要进行的运动视频内容分类奠定基础[3]。对于如何有效分类运动视频内容，国内很多学者进行了大量研究。文献[4]所采用的运动视频特征为含有颜色、编辑信息的多维特征向量;文献[5]采用超过两种以上特征，将运动视频内容划分为多个类型。这两种算法均采用决策树作为运动视频内容的分类器。文献[6]基于两级编码后的运动视频内容时域、空域联合深度特征，采用分层的支持向量机对运动视频内容进行自动分类。

以上所描述的运动视频内容分类算法使用的都是被动监督学习的方式，根据用户事先标记的运动视频训练样本来训练分类器，之后对未知类别的运动视频内容进行分类。这种方式需要有大量的训练样本做支撑，才能获得较好的分类效果，费时费力。本文针对未知类别运动视频内容，采用融合主动学习方式的改进支持向量机，对运动视频内容进行分类。实验结果表明，所提算法相比现存其他分类算法在运动视频上具有更好的分类性能。

1 基于稀疏表示的运动视频内容去噪

依据稀疏表示理论可知，运动视频中噪声信息含有两部分：一部分是运动视频内容中的稀疏成分，代表运动视频的结构信息;另一部分为运动视频内容除稀疏成分外的部分，即无用噪声信息，噪声信息中不含有运动视频帧的结构信息[7]。本文提出的基于稀疏表示的运动视频内容去噪，依据运动视频中的稀疏成分划分结构信息、噪声信息和无用的静止信息，完成噪声信息和无用的静止信息的有效滤除。通过运动视频内容的稀疏分解可获得视频内容的一种线性描述，即：

[f=k=0∞Rkf，gγkgγk] （1）

式中，[Rkf，gγk]表示运动视频内容[Rkf]或内容残差[Rkf]在相应原子[gγk]上的分量，对于含有噪声的运动视频内容[f]可描述如下：

[f=fs+fn] （2）

式中：[fs]表示运动视频中的有用信息即稀疏成分;[fn]表示视频中的噪声信息或无用静止信息。

与以往视频图像去噪方式不同，本文提出的基于稀疏分解的运动视频图像去噪是根据所提取的稀疏成分重构运动视频图像，以此达到噪声滤除的目的[8]。使用KSVD算法完成運动视频图像的自适应稀疏表示。KSVD算法可将超完备字典的训练过程和优化过程相结合，使训练获得的超完备字典能够更全面地描述运动视频内容。

2 运动视频内容特征提取

将第1节去噪后的运动视频内容进行非重叠切分，得到大小为[h×h]的不相重叠的小块。采用主成分分析法提取切分后视频片段中各个像素点[（i，j）]的特征构造特征向量[U（i，j）]。设定集合[（x，y）]表示视频图像块[h×h]内像素点的坐标，经过上述操作后，可构建协方差矩阵：

[Σ=1M（ikd（x，y）-Γ）（ikd（x，y）-Γ）T] （3）

式中：

[Γ=1Mk=1Mikd（x，y）] （4）

[T]表示矩阵转置;[Γ]表示元素[id（x，y）]的均值向量，满足[1≤k≤M]，[M=（H×W）（h×h）]。所描述的矩阵大小为[h2×h2]，且含有[r（r=h2）]个特征向量。

采用[Σ]可获得运动视频片段中像素点[（i，j）]的投影向量[U（i，j）]。设定[λl]表示[Σ]的第[l]个特征描述项，根据特征描述项大小进行排序，即[λ1≥λ2≥…≥λr]，这些特征描述项对应的特征向量可描述为[wi]，从中选择[S（S≤r）]个特征向量可获得：

[W（i，j）=[w1，w2，…，wS]] （5）

将元素[id（x，y）]投影至特定的特征向量空间中，在此空间中经降维处理可获得特征向量空间[W]。由于运动视频内容中的每一个像素点[（i，j）]均可以向特征向量空间[U（i，j）]投影[9]，因此可以获得该像素点在特征向量空间的投影向量，即构造空间像素点[（i，j）]维度为[S]的特征向量：

[U（i，j）=[u1，u2，…，uS]T] （6）

[uS=wTS（id（x，y）-Γ）] （7）

主成分分析法构造的特征向量空间[W]与其相应的均值向量[Γ]均可以将空间内的每一个像素点映射至低维空间[10]。与其相应的[r-S]个特征向量被除去，致使高维空间结构与低维空间结构不同。当运动视频帧受到噪声影响时，视频内容相应的特征描述项对应的特征向量通常与噪声相关，将这部分数据去除可以达到滤除噪声的效果。

3 基于改进支持向量机的运动视频内容分类算法

3.1 支持向量机分类器

假设，线性可分的运动视频内容样本集合为[S={（xi，yi）i=1，2，…，n}]，其中[xi∈Rd]，[yi={+1，-1}]表示[xi]相应的类别标签。[g（x）=w?x+b]表示[d]维特征空间中线性判别函数，其相应的分类面方程可描述为[w?x+b=0]，将判别函数[g（x）]标准化处理后可使不同类别的运动视频样本均满足[g（x）≥1]，此时分类间隔等同于[2w]。可知，若使分类间隔面最大就等同于使[w]为最小。这就要求分类超平面对全部运动视频样本均能正确划分，满足：

[yi[（w?x）+b]-1≥0] （8）

满足式（8）的条件的分类超平面即最优分类面。而两类运动视频内容中距离分类面较近的点且与最佳分类面[H1]，[H2]相平行的训练样本，即式（8）中等号成立的那些样本，可将其描述为支持向量。最佳分类面问题可描述成在式（8）的约束下，求取目标函数[?（w）]的极小值问题。

[?（w）=12w2=12（w?w）] （9）

对于运动视频内容线性不可分情况，引入松弛变量[ξi]以及惩罚因子[C]，将目标函数转换为：

[?（w，ξi）=12（w?w）+Ci=1Nξi] （10）

引入拉格朗日乘子[（α1，α2，…，αN）]，可将式（10）变换为具有约束条件的求解最优分类面问题，所得解为[w=iαiyixi]，则运动视频内容最佳分类函数可描述为：

[f（x）=sgn{（w?x）+b}=sgni=1Nαiyi（xi?x）+b] （11）

支持向量机本身为一个两类的分类器，而本文所研究的运动视频内容类别是未知的，可将其视为多分类问题。解决支持向量机多分类问题通常采用1?against?1，

1?against?rest，SVM决策树法等方法，本文采用1?against?1方法构建多类分类器。

3.2 融合主动学习机制的改进支持向量机

本文研究的一个[k]类运动视频内容的分类问题，目的是估测各个运动视频样本[x]对应于第[i]类的后验概率[pi]，首先计算运动视频样本成对的类概率估计：

[rij=p（y=iy=i 或 j，x）] （12）

式中，[pi]可根据求解式（13）给出的优化问题获得：

[minp12i=1kj≠i（rjipi-rijpj）2s.t. i=1Mpi=1，pi≥0] （13）

记录[pi]最大的[i]为[imax]，从其后验概率角度分析，可将分类器对运动视频样本的置信度[Con]设定为：

[Con=pimax-max1≤i≤k，i≠imaxpi] （14）

通过上述过程，确定运动视频样本选取机制后，本文所提出的融合主动学习机制的改进支持向量机分类算法流程如下：

1）初始化[n]，[N];

2）依据初始条件构建运动视频训练样本集合，确保不同类别的运动视频至少有一个样本;

3）依据所构建的运动视频训练样本集训练融合主动学习机制的改进的支持向量机分类器[C];

4）使用改进的支持向量机分类器[C]对剩余运动视频样本进行分类并预测其后验概率，经过式（14）的计算，将置信度较低的[n]个运动视频样本提交给用户，用户对其进行标记。

5）将用户标记过的[n]个运动视频样本加入训练集中，重复步骤3），假设当前运动视频训练集中的样本数量大于[N]，则算法终止。

4 实验结果与分析

4.1 实验环境和实验数据

为了验证本文提出的基于改进支持向量机的运动视频内容分类算法的综合性能，在Windows Server 2012R2 Intel[?]XeonTM CPU E5?2650@2.30 GHz，with 32.0 GB of RAM环境下，采用Matlab 2014a编程平台进行仿真实验。实验选取300 min的不同类别的运动视频集，可划分为517个运动视频片段，如表1所示。对不同类别的运动视频，随机选取30个片段作为训练样本构建训练样本集合，剩余片段作为测试样本集合。

4.2 分类性能

本文提出的基于改进支持向量机的运动视频内容分类算法中，各个分类器通过对100个正例和100个反例进行训练后，对剩余运动视频样本构造测试样本集。为了检验基于改进支持向量机的运动视频内容分类算法的性能，选取常用的查全率（NR）和查准率（NC）来度量分类算法的性能。

[NR=NCNC+NM×100%] （15）

[NP=NCNC+NF×100%] （16）

式中，[NC]，[NM]，[NF]分别表示运动视频内容正确分类的个数、漏检的个数以及误检的个数。依据式（15）、式（16）计算得到不同指标数据，如表2所示。

由表2可知，不同类别的运动视频内容查全率和查准率均高于90%，平均可达到94%。这说明本文提出的基于改进支持向量机的运动视频内容分类算法是有效的。进一步对误判的运动视频片段进行分析可知，很多误判运动视频内容都属于观众、裁判这一类视频内容构成的视频片段。对这类视频片段进行滤除，能够进一步提高查全率和查准率。

5 结语

运动视频内容的分类可以幫助人们更快速、准确地对视频内容进行管理和查询。本文提出基于改进支持向量机的运动视频内容分类算法。将主动学习策略融入到运动视频内容分类中，并提出根据拟合后验概率来计算支持向量机分类器，选取运动视频样本置信度样本。这种融合主动学习策略的改进支持向量机可在不降低运动视频内容分类精度情况下减少费时费力的人工标注。实验结果表明，所提算法能够有效地对运动视频内容进行高精度分类。

参考文献

[1] 潘丹，关卫军.基于隐马尔可夫模型的体育视频分类方法[J].湘潭大学自然科学学报，2017，39（1）：73?77.

[2] 吴梓尚，林辉，孙华，等.基于MODIS影像的森林类型决策树分类方法研究[J].中南林业科技大学学报，2017，37（9）：80?85.

[3] 肖艳芬，陶宝峰，张华丽.基于热成像数据与FLD的体育运动分类方法[J].湘潭大学自然科学学报，2017，39（1）：91?94.

[4] 卞建勇，徐建闽.基于C4.5决策树的视频车辆车型分类算法[J].微电子学与计算机，2017，34（5）：104?109.

[5] 陈丽萍，孙玉军.基于不同决策树的面向对象林区遥感影像分类比较[J].应用生态学报，2018，29（12）：3995?4003.

[6] 智洪欣，于洪涛，李邵梅.基于时空域深度特征两级编码融合的视频分类[J].计算机应用研究，2018，35（3）：926?929.

[7] 赵小强，张露.一种改进的数据挖掘模糊支持向量机分类算法[J].兰州理工大学学报，2017，43（5）：94?99.

[8] 冷强奎，刘福德，秦玉平.一种基于混合二叉树结构的多类支持向量机分类算法[J].计算机科学，2018，45（5）：220?223.

[9] 杨志民，王甜甜，邵元海.面向不均衡分类的隶属度加权模糊支持向量机[J].计算机工程与应用，2018（2）：68?75.

[10] 邵元海，杨凯丽，刘明增，等.从支持向量机到非平行支持向量机[J].运筹学学报，2018，22（2）：55?65.