基于乒乓球比赛技战术的统计推断方法研究

2021-07-08 07:59颖,吴
广州体育学院学报 2021年3期
关键词:张本技战术发球

丁 颖,吴 飞

(1. 天津科技大学体育教学部,天津 300222;2. 北京大学体育教研部,北京 100871)

法国数学家Pierre-Simon Laplace(1749—1827)认为“概率论”可以应用于人类整个知识系统,因为真理的发现是主要以概率为基础的。在医学科学研究中,Philippe Pinel(1745—1826)甚至宣称只有应用概率计算,医学才能成为一门真正的科学[1]。这些思想距今已有200余年,体育领域中尤其是运动训练学中不同体育项目的技战术分析中,仍缺少科学的、可靠的统计学方法运用。

体育领域中无论是体育社会学研究还是应用型研究皆缺乏较为深入“概率论”研究,数据处理缺少坚实的统计学方法运用。产生的原因可能是:一、体育项目的技术战术特点决定了各种体育项目独特的研究特点和分析角度,片面地研究数据容易脱离实际,需要研究人员对专项技战术有较为深刻的认识,但这部分体育专家可能不熟悉“概率论”;二、体育统计方向和运动训练学方向的专家,对统计学有较为深刻的认识,但是对不同体育项目复杂多变的技战术指标,研究不够深入。在科学研究领域,前沿交叉学科对于科技进步有强大的助推力;但在体育界也需要这种内部的深度交叉融合,才能真正助力运动训练学不同项目的科学化探索。在大数据时代,竞技体育既需要传统的师傅带徒弟式的“心领神会”,也需要各种数据的科学收集、严谨分析,帮助教练员、运动员做出更加理性、科学的决策,需要定性研究和定量研究的深度融合[2]

本文是在深入理解乒乓球技战术分析研究的基础上,对竞技乒乓球技战术分析的统计方法进行探究。研究目前此领域研究生学位论文在统计方法中普遍存在的问题,在此基础上提出具体的统计方法运用思路。需要指出的是无论是卡方检验、秩和检验,还是logistic回归模型都是较为成熟的统计方法,在体育领域中也有较多的应用,但在竞技乒乓球的技战术分析中缺乏此类方法的相对规范的应用探究。

本文从乒乓球技战术分析的角度出发,用统计学的思维对乒乓球技战术的统计学概念进行定义,对专项数据类型进行梳理,并根据数据类型选取相应的统计方法,使乒乓球技战术分析向纵深推进;第二,希望对体育院校乒乓球专业研究生的技战术分析方面的学位论文所采用的统计方法能有所改进。

1 乒乓球技战术分析中统计学主要概念

1.1 乒乓球技战术分析中的总体与样本

在统计学中,用总体(population)来表示全体对象。以乒乓球技战术研究为例:所有横板打法的女子运动员,所有的混合双打配对,所有发球技术,所有接发球技术……当我们试图对某个总体下结论,这个总体被称为目标总体(target population);而数据通常来自于目标总体的一部分,被称为研究总体(study population)。比如研究横板男子运动员的发球抢攻战术。中国横板进攻型打法的男子运动员只是其中的一部分,是研究总体。

研究总体中的个体(individual)有很多,甚至无限多。比如我们研究张本智和技战术时,不可能收集到张本所有参加过的日本国内和国际比赛中的数据。科学的方法是从研究总体中(张本智和所有比赛的技战术数据)抽取少量有代表性的个体(重要比赛的技战术数据),称为抽样(sampling),对这些部分张本智和比赛组成的样本(sample),进行观察和测量,获得数据(各项技战术数据集);利用统计学知识,通过对样本数据的研究对研究总体(张本智和的技术战术)的规律进行推断(inference)[3]。

1.2 乒乓球技战术分析中的数据同质与变异

总体是由许多个体组成,这些个具有同质性(homogeneity),又有变异性。比如研究张本智和的技战术分析。张本的各项技术是有共性的,有着张本的技术特征体系,这是同质性;但他对不同的对手可能技战术运用会有不同的方式,因此他的技术运用之间又有变异。没有同质性就构不成一个总体供科研工作者研究,总体内没有变异也就无需统计学。统计学的任务就是在变异的背景上描述同一总体同质性,揭示不同总体的异质性(heterogeneity)[4, 5]。

1.3 乒乓球技战术分析中的统计推断方法

统计推断的基础就是概率论。人们凭借样本数据来推断总体各种可能结局的概率。由于是从部分推断总体,因此统计学的结论从来就不是完全肯定或完全否定。在研究客观现象总体的数量关系时,需要了解的总体范围往往很大,有时甚至是无限的,而由于经费、时间和精力等各种原因,以致在客观上往往只能观察部分单位或有限单位进行计算和分析,根据观察结果来推断总体[6]。例如我们对比张本和马龙的发球抢攻得分率,我们抽取几场比赛,进行数据测量和收集。如果这几场比赛的得分率不同,我们能推断两人的发抢得分率不同(直接对比得分率)吗?如果,我们再换几场比赛进行统计,可能得分率与前面的“抽样”得出的数值也不一样。那么这种不同是选取的比赛不同造成的,还是张本和马龙的技战术总体不同?这都需要统计推断来回答。

在一定置信程度下,根据样本资料的数量特征,对总体的数量特征作出估计和预测的方法称为统计推断法。统计推断法是现代统计学的基本方法,在统计研究中得到了广泛的应用。

1.4 乒乓球技战术分析中的数据变量类型

总体中个体的特性总是通过一个或多个变量来描述,变异性的存在决定了研究要处理的是变量(variable)[1],而识别变量的类型非常重要,不同的变量类型需要用不同的统计分析技术。本研究将乒乓球技战术分析中变量分为两种:定性变量(qualitative)、定量变量(quantitative)。

定性变量是乒乓球技战术研究领域最常见的变量类型,也称分类变量(categorical variable)。如按照乒乓球比赛的段落划分(经典的三段分析法):发抢段、接抢段、相持段;按照乒乓球击球顺序的分类:发球、接发球、发球抢攻(第三板)、接球后抢攻(第四板)、第五板和相持技术;按照不同击球顺序再次细分的技术类型,如发球分为:正手发球、反手发球;下旋球、上旋球;发短球、发长球;侧旋发球、逆旋转发球;正手位发球、侧身位发球等;接发球分为:接发球控制、接发球抢攻。接发球控制中再分为:摆短、劈长;接发球抢攻分为:正手挑、反手拧、正手拉、反手拉、侧身拉等技术;而分析中最重要的是最后的得分和失分,这是二分类变量。

有时搜集数据的科研人员需要对每一板回球的质量进行人为定义:“好”“中”“差”,这种变量为有序变量。由于需要收集数据的人员根据接球者的技术质量来人为定义和分类,对数据信度有一定损伤,目前这种收集数据的方法日趋减少。但在统计收集单板技术时,加入质量的评价,在一定程度上获取了很多的有效信息。

乒乓球研究领域也有定量变量。比如我们研究马琳捡球时间长短对于比赛结果的影响。收集的数据是从每一个球结束比赛状态后到马琳或者马琳的对手发球时将球向上抛弃的一瞬间开始计时。收集测量每一个球之间的时间和下一个发球的胜负。时间间隔为定量变量,属于定量变量中的连续型变量。但这样的研究不多,本研究主要分析定性变量[7]。

2 统计方法在乒乓球技战术分析中运用情况

在CNKI学位论文数据库中,设置时间范围:2015—2020年,用“主题”方式模糊搜索“乒乓球技战术”,共计有169篇学位论文,全部为硕士论文。从169篇学位论文的关键词共现网络图和关键词分布文献篇数图,我们可以看到关于研究方法主要是:录像观察法;研究较多的内容是得分率(82篇),发球抢攻(80篇),乒乓球运动员(48篇)。在乒乓球技战术分析中主要的研究点是乒乓球技术、得分能力、进攻能力、发球技术,以及具体的运动员,如张继科、李晓霞、伊藤美诚,见图1,图2。

图1 2015—2020年乒乓球技战术分析学位论文关键词共现网络

图2 关键词分布文献篇数

2.1 数据收集缺乏可靠性

乒乓球技战术分析的学位论文中,对于数据收集的描述较为简单。仅以2020年一篇研究樊振东和林高远技战术分析的学位论文为例。作者对两位运动员各选取14场国际比赛。但这些比赛的对手包含左手直板、左手横板、右手横板、右手直板选手,在没有任何说明的情况下,将所有三段(发抢段、接抢段、相持段)的得失分率累积计算。但,左手和右手技战术、线路都有一定的区别,即使是同一种打法的运动员,技战术也会存在很大差异。比如王皓和马琳都是右手直板打法的运动员。但是王皓的打法偏重于横打,以反手为进攻体系;马琳则恰恰相反,运动员的发抢得分率的特点也有很大区别。如果没有考虑这些最直接的影响因素,在这种数据基础上得出的结果,研究的信度和效度都会有较大影响。

2.2 研究方法缺乏基本的统计推断

169篇乒乓球技战术分析论文中,有2篇是计算机专业关于乒乓球技战术相关软件方面的论文;关于赛事演变、规则演变、文献综述(知识图谱)、训练方法、新指标对技战术有影响方面的论文,但不涉及对技战术指标分析的论文,各有1篇。剔除后,余162篇近5年内关于乒乓球技战术分析方面的学位论文,其中仅5篇有推断统计,占3.09%。1篇运用了BP神经网络模型和多元回归模型;1篇运用了logistic回归模型;1篇运用t检验;3篇无统计方法说明,仅在表格上出现P小于或者大于0.05。也就是说,在高校的运动训练和体育教育专业中,乒乓球方向的研究生或专硕的学位论文中有约97%(见图3)的技战术分析论文中没有基本的统计推断方法运用,直接对比运动员的得失分的百分比,见图4。

图3 2015—2020年乒乓球研究方向学位论文是否采用统计推断的百分比

图4 硕士学位论文中技术分析常见表格

这种数据对比的结果,表明学生仅对他们各自选取的一些比赛进行了抽样计算。如果,我们再换几场比赛进行统计,可能得分率与前面的“抽样”得出的数值也不一样。那么这种不同是选取的比赛不同造成的,还是马龙与波尔的技战术总体不同?(见图5)这都需要统计推断来回答。如果没有推断统计,很有可能意味着对比分析运动员技战术时,数据差异只是抽样误差所致,而不是运动员的技战术存在相对真实的差异。因此,需要从样本对总体进行统计推断就显得更加科学严谨和有意义。

图5 乒乓球技战术分析中抽样与总体的关系

我们要对这种现象要高度重视,对于乒乓球方向的研究生或专业硕士的培养需要有基本的学术训练,而这学术培养直观地体现在学位论文的撰写水平。

2.3 研究方法写作不规范

学位论文在研究方法方面表现不规范的主要为对数据收集、数据整理、数据处理等必要环节没有必要说明[8]。比如数据缺失如何处理?左手运动员和右手运动员的数据,直板和横板运动员的数据为什么能够放在一起?是否需要对不同类型的运动员的数据进行差异性检验,在统计学上无差异后再进行合并?如果没有更好的方法,这样处理数据对结果可能会有怎样的影响?

在写作中,有论文表格中出现P值,但是在文章中并未对统计方法进行说明;以前的统计数据需要手动计算,现在基本都依赖统计软件计算,P值能直接得出,在其它专业的论文中有的期刊明确要求要注明P值大小,而不是笼统地列出大于或小于0.05。

3 统计方法在乒乓球技战术分析中的应用案例

在乒乓球方向的研究生学位论文中,技战术分析基本围绕三段法展开,对于不同项目不同性别的运动员技战术进行对比分析。本文仅就此方面的研究提出一些具体的统计推断改进思路和方法,期望为能为乒乓球方向的研究生培养提供一些启发,见图6。

图6 乒乓球技战术推断统计方法

卡方检验时,两个独立样本比较分为以下3种情况:

1.所有的期望频率≥5,且总样本量n≥40,用Pearson卡方进行检验

2.期望频率<5,但≥1,并且n≥40,用连续性校正的卡方进行检验.

3.如果期望频率<1或n<40,则用Fisher’s检验;

R×C列表若有1/5以上格子数的1≤期望频率≤5或者一个格子的期望频率<1,则不能直接用卡方检验。可以采用删除或合并的方式使期望频率符合适用条件[9]

3.1 卡方检验(χ2检验,chi-square test)

χ2检验(chi-square test)是现代统计学之父Karl Pearson开创的。Pearson将一个学科的描述性统计改变为推断性统计。χ2检验的理论基础是χ2分布和K.Pearson拟合优度检验。χ2检验的基本思想是用统计量度量实际频数和理论频数之间的偏离程度。

本研究选取核心期刊中乒乓球技战术分析的部分案例,根据变量类型进行

χ2检验。使用SPSS 20.0进行数据处理(注:由于所有数据均为汇总数据,因此检验之前需要进行“个案加权”)。

3.1.1 两个独立样本资料的χ2检验应用案例

表1 林高远对波尔1场比赛动态三段指标统计[10](无统计推断)

运用两个独立样本χ2检验分别对林高远和波尔的发抢段、接抢段和相持段进行显著性检验,三段均在在统计学上没有显著差异。即林高远和波尔的三段技术水平在统计学上没有高低之分,得分率不同可能是由于抽样误差,或者样本量较小所致,见表2。

表2 林高远对波尔三段指标对比分析[10](有统计推断)

3.1.2 多个独立样本R×C列联表资料的χ2检验应用案例

表3用多个独立样本的R×C的χ2检验,χ2=7.30,P值<0.05,说明林高远、波尔和许昕的发抢段得分率在统计学的差异显著。许昕的发抢段得分率最高,为63.9%,林高远的最低为43.9%。一般在三段中有显著差异后,我们会进一步对发抢段中的发球类型和发球抢攻类型和质量再进行下一步的研究。

表3 林高远、波尔、许昕发抢段得分率对比分析(含χ2分析)

需要特别指出的是:多个样本率比较的卡方检验,结论拒绝H0,只能认为是多个总体率之间有差别,但不意味着任何两组都有差别。对率的多重比较,目前没有公认的方法,有人认为可以做2×2独立样本卡方检验,要调整显著性水平;原来的检验水平α=0.05,进行3组间的两两比较时一共要进行3次,每次检验水平应取α’=0.05/3=0.0167。这是Bonferroni调整法思想在多个率间两两比较的应用。也有人认为可以用logistic回归进行组间比较。

一般认为, R×C列表若有1/5以上格子数的1≤期望频率≤5或者一个格子的期望频率<1,则不能直接用卡方检验。可以采用删除或合并的方式使期望频率符合适用条件。比如,可以将运动员的发球摆短、劈长合计为“发球控制”,但会损失数据信息。也可以采用“精确概率法”。

3.2 秩和检验

以特定的总体分布为前提,对未知的总体参数作推断的假设检验方法统称为参数检验。χ2检验和方差分析均要求样本来自正态总体,属于参数检验。非参数检验不以特定的总体分布为前提,也不对总体参数作推断,故也称为任意分布检验(distribution-free test)。秩和检验(Wilcoxon rank sum test)是Wilcoxon于1945年提出的检验方法,也称符号秩检验,是非参数检验。检验的目的是推断有序变量资料的两个或多个独立样本代表的总体分布位置是否有差别。

3.2.1 两组单项有序变量的秩和检验

运用秩和检验中Mann-Whitney U检验对马龙和张本智和的接发球摆短进行统计检验,见表4。Z=-6.313,p值<0.05,说明马龙和张本智和在接发球摆短的质量上在统计学上有显著差异。数据显示,马龙的接发球摆短要优于张本智和。

表4 马龙、张本智和接发球摆短质量对比分析(含秩和检验)

本应用案例仅对一项技术进行统计检验,在实际研究中接发球的种类有多种,如果进行对比分析,则需要对每一项技术的测量数据进行逐一的统计检验。

3.2.2 多组单项有序变量的秩和检验

运用秩和检验Kruskal-Wallis H检验对马龙、张本智和和波尔的接发球摆短进行统计检验,见表5。χ2=21.484,p值<0.05,说明马龙、张本智和、波尔在接发球摆短的质量上在统计学上有显著差异。但三名运动员两两之间是否有差还需要进一步统计检验。

表5 马龙、张本智和波尔接发球摆短质量对比分析(含统计检验)

现阶段对运动员技术质量进行评价后,测量收集数据的研究较少,这是由于在测量的时候有较多的主观判断。但,在单板技术测量评价中,直接与最后得分相关联的方法,其合理性也有待商榷。因此对于单板的直接评价可能也是一种有用的研究方式。

4 结论与建议

4.1 结论

乒乓球技术战术分析经过了几代乒乓球科研工作者的努力,已经形成了独有的研究体系。国家队一线教练员和运动员也都对乒乓球的科研统计数据非常重视。

4.1.1 对不同运动员N场比赛的技术数据进行收集,在统计学中属于抽样,我们研究的目的是要分析这些样本之间的误差是抽样误差所致还是总体确实存在差异。

4.1.2 没有同质性就构不成一个总体供乒乓球科研工作者研究,总体内(运动员的整体实力)没有变异也就无需统计学。统计学的任务就是在变异(技战术数据不同)的背景上描述同一总体同质性,揭示不同总体(运动员技战术总体)的异质性(heterogeneity)。

4.1.3 现有的测量、收集数据、评价指标都较为完备,但缺少基本的统计推断分析,使体育院校培养的乒乓球专业的研究生依然在不断重复数据收集的练习,而缺失本专业的统计学处理方法训练。学位论文中主要出现的问题为:数据收集缺乏可靠性;研究方法缺乏基本的统计推断;研究方法写作不够规范。

4.1.4 本研究根据乒乓球技战术分析中指标的主要特点,将χ2检验与秩和检验的原理、应用进行了较为详尽的探讨。对于两名运动员的关于率的分析,运用两个独立样本列联表的χ2检验;多名运动员则用多个独立样本R×C列联表资料的χ2检验;对于两名运动员之间的技术质量评定,采用运用秩和检验中Mann-Whitney U检验;多名运动员则采用运用秩和检验Kruskal-Wallis H检验。乒乓球的技战术分析表格多为列联表的形式,属于汇总数据,在进行检验之前需要加权处理。多名运动员之间的比较,如果有显著性差异,并不代表两两之间有差异,需要进一步统计分析。

4.2 建议

4.2.1 进一步改进和丰富体育教育和运动训练学中,乒乓球技战术分析的统计推断知识体系。

4.2.2 高校在培养体育教育和运动训练学乒乓球方向的研究生时,要加大统计学方面的学术训练。

猜你喜欢
张本技战术发球
基于熵值法与灰色关联度分析法的羽毛球技战术综合评价分析
破解电动车火灾扑救关键技战术的几点思考
对女子花剑近距离交锋技战术运用特征的探究
对当今世界高水平男排比赛发球体系的研究
乒乓球削攻结合打法运动员三段技战术分析模型的建立*
揭秘张本智和专属团队
张本煜,韩寒说他值得比现在更红十倍
神 探
发球上网的步伐
对发球的理解和体会