基于支持向量机的自行车运动员综合素质评价体系研究∗

2019-05-07 02:32韩美林乔成芳
计算机与数字工程 2019年4期
关键词:遗传算法准确率素质

杨 琳 李 媛 杨 艳 韩 婧 韩美林 乔成芳

(1.商洛学院 商洛 726000)(2.商洛市体育局 商洛 726000)

1 引言

随着自行车运动的流行与普及,越来越多人成为专业运动员参与到自行车比赛当中。自行车运动员的综合素质的高低是决定车队比赛成绩的关键。对自行车运动员综合素质的科学评价成为一项重要的问题[1~2]。前苏联在 1980年奥运会信息网络的基础上成立了全苏体育自动化管理研究所,其计算机中心拥有庞大的数据库,包括运动员档案、训练、比赛、营养、体育设备、经费等各方面的数据。在20世纪90年代,我国一些科技工作者完成了大规模的关于自行车运动员科学选材标准的课题[3~5],取得了很多成果,包括获得自行车运动员各项信息的大量数据,为自行车运动员的综合素质评价提供了科学的理论依据。一直以来,诸多学者从自行车远动员的专项能力、身体素质、运动能力、遗传、心理素质等方面展开了研究并取得了很多成果,为运动员选材和训练实践提供了广泛的理论依据和实际应用方法。刘元田[6]开发了自行车运动员选材软件,平渊[7]、崔建光[8]分别研究了自行车运动员身体特征与专项技能的关系,但仍存在评价结果与实际差距大、评价方法不合理、评价主体的不完善、评价内容不完整等问题。与此同时,近五年来人工智能的发展较为迅速,尤其是BP神经网络[9~10]、支持向量机[11~12]、遗传算法[13]、深度学习[14]等智能算法理论得到爆裂性的发展,广泛应用于语音识别、图像分类、智能控制、股票预测等。本文提出利用支持向量机和遗传算法这样的智能算法来设计一套自行车运动员综合素质评价体系,选取225个运动员的身体形态、身体机能、运动能力、专项能力4类指标中的16个影响因素数据,进行了较为全面的数据分析,改进了搜寻网络参数的遗传算法,提高了识别准确率和效率。

2 自行车运动员素质评价体系的构建

2.1 构建方法与设计原则

建立自行车运动员综合素质评价体系需要遵循以下原则,包括科学性、可执行性、重点因素属性值突出等。

1)科学性:自行车运动员综合素质评价体系复杂,建立指标体系要全面、有主次、简约、独立性好,同时需要涵盖运动员素质的各个方面,选取指标和因素需以“素质”作为重点,具体要结合自行车运动员的自身特点;为了得到公平、公正的评价结果,采集数据和对数据的预处理也需要有科学性。

2)可执行性:在建立自行车运动员综合素质评价体系时,要考虑到指标、因素数据获取的可操作性,数据必须表示明确、表达简洁、易于采集和处理,必须方便采集数据并处理。

3)重点指标突出:建立自行车运动员综合素质评价体系时必须有主有次,突出速度、踏频等重点指标。

2.2 指标体系构建

自行车运动员的综台素质包括多个方面,采用层次分析法,将这些指标分为三层:目标层、指标层、因素层。本课题从身体形态、身体机能、运动能力、专项能力四个指标作为评价的标准,再综合考虑各个指标的详细情况和相关性,将这四类指标具体细分为如图1所示的16项因素。

1)身体形态指标是指反应身体生长情况的各项素质,包括克托莱指数(X1)、肩宽身高比(X2)、胸围身高比(X3)、比踝围(X4)。这些因素反应了运动员的身体形态,对运动员的骑行速度、稳定程度有举足轻重的影响。

2)身体机能指标是指反应身体健康状况的各项素质,包括体脂率(X5)、血红蛋白含量(X6)、安静心率(X7)、最大摄氧量(X8),这些因素直接影响着运动员是否能够正常训练或比赛。

3)运动能力指标是指反应身体在体育运动方面的各项素质,包括无氧阂值(X9)、60m跑时间(X10)、选择反应时(X11)、立定跳远距离(X12)。这些因素决定了运动员在队伍中间的位置。

4)专项能力指标是指反应自行车运动方面的各项专业素质,包括30s平均踏蹬频率(X13)、30s最大功率(X14)、30s最大心率(X5)、神经类型(X6)。这些因素是确定运动员能力的关键性专业因素。

图1 自行车运动员质素质评价指标体系

3 神经网络评级模型概述

3.1 神经网络

神经网络,又称作人工神经网络(Artificial Neural Networks),是一种模仿动物或者人的神经网络运作模式的数学模型,这种网络有大量的神经元,包括输入层、隐含层、输出层,节点之间的关系称为权重。权重值、输入、迭代次数决定了网络的输出。通过一次次迭代,调整关系权重,从而得到最理想的输出。能够自适应和自学习是人工神经网络最突出的特性。

3.2 支持向量机

支持向量机(Support Vector Machine,SVM)是一种神经网络算法,属于有监督学习的神经网络模型,广泛应用于模式识别、线性回归、聚类、数据分析等领域。给定一组训练样本,每一个样本去标记分类,一个SVM训练算法建立了一个模型,分配新的坐标进行分类。一个支持向量机将在一维、多维、或无限维的空间中形成一个或多个超级平面,一个理想的分类器对于每一个分类都有最接近的训练数据范围,一般情况下裕度越大范化误差越大。

4 自行车运动员素质评价网络模型的构建与应用

4.1 网络结构建立

本文根据自行车运动员水平影响因素的分析,选择结构较为容易的CNN神经网络,并在该网络中引入SVM算法。因为当结构合理、投值条件也相对恰当的条件下,CNN网络容易逼近到任意的里阿奴函数。选择表示运动员水平的16个因素作为系统的输入层,而将反应自行车运动员水平和影响因素的映射关系作为隐含层,评价等级作为输出层,输出结果的可能性有1,2,3,4,5,6六种,分别表示自行车运动员的综合素质评价等级为优秀,良好,一般,合格,较差,差。根据分析的结果,建立SVM神经网络模型如图2所示。

建立了自行车运动员素质评价指标体系后,每个指标需要有权重值,咨询相关领域专家后,利用层分析法,经过数据计算与分析,得到指标的权重。目标层之于指标层的权重向量为A=[0.09,0.20,0.34,0.37],其含义是身体形态、身体机能、运动能力、专项能力四个指标对评价结果的影响分别为9%、20%、34%、37%。因素层相对于指标层的权重向量为,B1=[0.3,0.2,0.2,0.3]、B2=[0.17,0.28,0.11,0.44]、B3=[0.29,0.21,0.27,0.23]、B4=[0.3,0.3,0.28,0.12]分别表示克托莱指数、肩宽身高比、胸围身高比、比踝围这些因素对身体形态指标的影响程度分别为30%、20%、20%、30%;体脂率、血红蛋白含量、安静心率、最大摄氧量这些因素对身体机能指标的影响程度分别为17%、28%、11%、44%;无氧阂值、60m跑时间、选择反应时、立定跳远距离、这些因素对运动能力指标的影响程度分别为29%、21%、27%、23%;30s平均踏蹬频率、30s最大功率、30s最大心率、神经类型这些因素对专项能力指标的影响程度分别为30%、30%、28%、12%。最后取几何平均值作为因素层的权重值C=[0.027 0.018 0.018 0.027 0.034 0.056 0.022 0.088 0.0986 0.0714 0.0918 0.0782 0.111 0.111 0.1036 0.0444]。

图2 自行车运动员综合素质评价指标网络结构

4.2 样本数据的选取和预处理

选取我国六个省级自行车队的225名男运动员的各项因素信息作为样本数据(Xij)m×n,有m个样本,n项因素(m=225,n=16),其中i为样本序号,范围是[1,225],而j为因素序号,范围是[1,16]。对每一项因素的225个数据做归一化处理,利用如式(1)所示的映射关系将每一项因素的数据范围转化到[0,1]。

这225个样本数据中选取前108个作为训练样本数据,后117个作为测试样本数据。各项因素归一化数据的box可视化效果和因素分维可视化效果如图3、图4所示,训练集的分类结果如图5所示。

图3 自行车运动员因素数据的box可视化图

图4 自行车运动员因素数据的分维可视化图

图5 训练集分类结果的标签分布图

4.3 模型训练与预测

SVM的核函数有径向、两层感知器、多项式、线性等非分类下的若干种函数。由于自行车运动员因素与结果之间的非线性关系,本文将RBF径向函数作为系统的核函数,主要是因为这个函数,能满足各因素属性值与标签值的非线性关系,所以更加适用于高维空间。RBF函数的输入输出映射关系如式(2)。

其中,γ是核函数的参数,x是样本值,模型中的默认系统参数是c=2,g=1。以样本中的前108项作为训练样本,建立模型后,以后117项数据作为测试样本,利用此模型进行预测。预测的标签值与实际标签值对比如图6所示,其准确率为87.1795%

图6 自行车运动员测试集预测结果

4.4 参数改进

默认的惩罚参数,得到的预测准确率并不理想,因此需要去调节参数。也就是寻找最佳的g参数和c参数,从而得到理想的预测准确率。常见的方法有粒子群优化算法(PSO)、网格搜寻法、遗传算法(GA)。在本文中利用这些方法来优化g参数和c参数。

4.4.1 网格搜寻法

网格搜寻法的基本思路是,先规定一个g参数和c参数的粗略搜寻范围,在这个范围内按照一定的顺序和步进,利用每一组参数去预测,得到一个最佳准确率对应的最佳参数组合。

执行第一次粗略搜寻后,进一步缩小搜寻范围并调整步进,再一次执行精细搜寻。本文中搜寻的结果如图7所示,其中粗略搜寻的结果如图(a)、(c),最佳参数为c=64 g=0.0110,准确率为 AC=93.2870%,精细搜寻的结果如图(b)、(d)c=6.9644 g=0.2415,准确率AC=94.7222%。

图7 网格法cg参数选择结果图

4.4.2 遗传算法

利用网格搜寻法,可以在一定范围内找到最佳的惩罚参数c、g,但是当搜寻范围比较大,或者步进值比较小时,这种方法就会耗费大量的时间。而引入遗传算法去选择惩罚参数,就不用遍历网格中的每一个点,很大程度上提高效率,节约时间。遗传算法的算法流程如图8所示,经过200次迭代,遗传算法确定最佳参数是c=5.650 g=0.25,cg参数的适应度曲线如图9所示,分类结果如图10所示,准确率为AC=96.8812%,时间从99.1372s减少到31.4341s。

图8 遗传算法获取最佳cg参数的算法流程

图9 获取最佳cg参数(遗传算法)的适应度曲线

图10 最佳cg参数下的预测结果(遗传算法)

4.4.3 改进的遗传算法

可以看出,遗传遗传算法提高了搜寻效率,但是,准确率还有待提高。本文在遗传算法的基础上提出了改进思路,将损耗函数ε引入到遗传算法模型中去优化,因为损耗函数ε同样会影响模型的预测准确率。改进算法的流程如下:

1)种群初始化,设置惩罚参数c、核函数参数g、损耗函数ε的初始范围,这个范围尽可能地设大一些。

2)计算并保存适应度。

3)当前种群数据处理后,顺序执行选择、交叉、变异过程。

4)查看结束迭代条件是否满足,满足,则将最好的参数输出;不满足,则继续下一轮迭代。

5)利用最优化的参数(c,g,ε)进行数据的预测,得到最佳结果。

用改进的算法得到最优参数为c=7.1166,g=0.2964,ε=0.1254。这组参数下,预测准确率为98.2906%,耗时为35.8811s。

4.5 结果讨论

表1 不同方法选择cg参数的效果对比

几种方法选择c、g参数的结果对比如表1所示。可以看出,比起默认的c、g参数,网格搜寻法的大大提高了准确率,但是耗时长增加了近乎200倍,主要是因为网格搜寻法遍历了有可能的所有参数点。精细搜寻比粗略搜寻缩小了范围,但是搜寻步进更小,意味着网格更加精细,二者耗时不相上下,在准确率上,精细搜寻略优于粗略搜寻。引入遗传算法来搜寻c、g参数,不用去遍历网格中的所有点,更加高效和智能,比起精细网格搜寻耗时降低了74%,准确率提高了2.1%。将遗传算法进行改进,把损耗函数ε的选择也引入到遗传算法当中,最终,进一步提高了识别的准确率到98.29%。

5 结语

将神经网络和支持向量机的理论应用于公路自行车运动员综合素质评价中,对225名运动员的四类指标16个因素数据进行预处理后,建立了SVM评价模型,利用这个模型对运动员的综合素质进行评价,得到以下结论。

1)为了提高网络模型的可信度,选择225项数据中的前108项作为训练集数据,后117项作为测试集数据,以评价类型作为网络的输出标签。实验结果表明,正确率在98%左右,能满足运动员综合素质评价的需求。

2)SVM算法克服了BP网络中神经元不稳定等缺陷,降低了人为因素对评价结果的影响,同时提高了网络模型的稳定性。

3)在预测的过程中参数c、g对预测结果有很大程度的影响,因此需要找到最佳的c、g参数。网格搜寻法,提高了预测准确率,但是耗时太长。GA算法的引入很大程度减少了耗时,提高了准确率。改进的GA算法将准确率进一步提高。

4)在训练过程中所使用数据样本不够全面,只有225条数据,这种数据量的局限性可能会一定程度地影响评价结果。在后续对的研究中,将尽可能地扩大数据量,来提高网络学习和预测的精准程度。

5)SVM和GA算法相结合的自行车运动员综合素质评价模型,准确率达到98.2906%,效果较为理想,为自行车运动员的选材、训练、比赛提供科学的方法和依据。

猜你喜欢
遗传算法准确率素质
素质培养目标下经管“专业课程链”构建研究
基于改进遗传算法的航空集装箱装载问题研究
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
多层螺旋CT技术诊断急性阑尾炎的效果及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
基于遗传算法的高精度事故重建与损伤分析
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
基于遗传算法的智能交通灯控制研究
公关摄影师必备素质
物流配送车辆路径的免疫遗传算法探讨