体育科学统计分析应用的现状与评价

2012-09-12 10:51曹远红
运动 2012年18期
关键词:适用性科学实验合理性

曹远红

(湖南师范大学体育学院,湖南 长沙 410012)

科学研究的目的是通过研究事物间的相互关系,阐明事物客观存在的规律性。而客观的规律是很复杂的,要考察交织在一起的各种因素之间的关系,就需要进行科学实验;为了合理解释实验数据中所反映的客观规律,就需要选择恰当的统计分析方法[1]。体育科学中,统计分析方法的掌握程度直接影响着体育科学前进的步伐。体育科学统计分析方法的应用状况如何?怎样进一步提高统计分析方法的应用水平?这正是本调查研究要解决的问题。

1 研究对象与方法

1.1 研究对象

本文旨在调查目前体育科学实验研究中统计分析方法的应用状况,将能够代表体育科学实验研究水平的期刊《体育科学》《北京体育大学学报》《体育与科学》3种核心期刊中611篇实验性研究论文的调查论文为调查对象。为考察体育科学统计分析水平的进展状况,调查时间定为2000-2008年。

1.2 研究方法

1.2.1 文献资料法 在中国知网上检索到1990-2008年体育科研中有关“统计误用”方面的文献共27篇,又在中国知网上检索到医学、生物科学方面的有关“统计误用”的文献共186篇。通过对以上资料收集、鉴别、整理与分析,确定了初步

调查指标和指标量化标准。

1.2.2 调查法 (1)预调查。预调查和正式调查都是由本人独立完成。预调查的研究对象是2000-2008年北京体育大学学报中各年第1期、第6期的实验性研究论文,共约60篇。预调查的目的一是确定样本含量,二是考察“最初调查指标和指标量化标准”的不足之处,然后对其进行必要的修正,建立“最终调查指标和指标量化标准”。

本调查研究中,采用抽样调查时总体率的估计方法计算样本量。公式如下:

其中,式中n为样本含量;α为第Ⅰ类错误,本次调查取0.05;δ为容许误差,根据以往调查经验,取0.04;预调查60篇论文中,统计分析合理的有15篇,所以总体率π为0.25,因此:

本次调查中,选取的3种核心期刊内的实验性研究论文共611篇,远远高于所需样本量,满足了调查需求。

指标的修正方法是“发现问题即刻修正”,没有对存在的问题规范化的分类描述。通过指标的修改、剔除等过程,使调查指标更能能够体现研究内容和研究目的(提高指标效度);通过指标定义的确切化、指标调查顺序的调整,使调查过程更加易于实施(提高可行性);通过指标的细分、准确量化、准确定义,提高指标的稳定性和敏感性。建立的“最终调查指标和指标量化标准”。(表1)

(2)正式调查。根据“最终调查指标和指标量化标准”制作调查表,展开正式调查并收集数据。调查顺序按“年”(3种期刊“卷”号不同,但都是每年1卷)进行,采用“隔年调查、顺序倒置”的方法,即调查顺序为2000年、2002年、2004年、2006年、2008年、2007年、2005年、2003年、2001年。每一年内的3种文献一起调查,顺序不确定。

1.2.3 数理统计法 本研究采用的统计方法有频数分布表、交叉列联表、x2检验等。

2 结果与分析

2.1 统计分析应用状况分析

2.1.1 总体实际应用状况 3种期刊611篇实验性研究论文中各种统计方法(实际统计)实际应用状况统计可知,统计方法应用较多的依次是t检验(45.5%)、单因素方差分析(26.8%)、多因素方差分析(3.9%)、重复测量方差分析(1.8%)、其他等。其中,统计方法不详,统计描述中只描述P值的占17.9%。“差值t/方”指前后测量差值的t检验或方差分析,是专门处理前后测量设计的统计分析方法,占1.1%。

2.1.2 统计方法逐年应用状况 由于“统计方法”中“差值t/方”、协方差分析、重复测量方差分析、多因素方差分析应用的频数较少,并且相对于t检验和单因素方差分析都属于较复杂问题的统计分析方法,所以可以把它们都称为“复杂统计分析”。t检验只能进行2组之间的对比分析,可认为是“简单统计方法”,单因素方差分析处理3组及以上之间的对比分析,可认为“较复杂统计方法”。最终进行逐年分析描述实际统计时只把“t检验”“单因素方差分析”“复杂统计分析”“统计不详,只有P值”纳入,结果见图1。

表1 最终调查指标和指标量化简表

图1 逐年统计方法应用频率

图2 各理论统计对应统计分析合理性分布

经x2检验,统计方法与卷(年)存在交互作用(x2=59.455,P=0.000<0.01),也就是说,统计方法应用状况在2000-2008年变化有非常显著性差异。2000-2008年t检验(简单统计方法)应用频率呈降低趋势;单因素方差分析(较复杂统计方法)应用频率呈上升趋势;复杂统计方法的应用频率也有上升趋势,但是上升幅度较小,至2008年,其应用基数仍然较小。统计方法越复杂,越容易正确地分析复杂的研究问题。体育科学实验研究中,研究者应用复杂或较复杂的统计方法的频率逐渐增多,体育科学实验研究统计应用方面正在不断的进步当中。

“不详,只有P值”,只用P值与显著性水平的大小来描述统计结论,而不明确表达统计方法的现象在逐渐减少,但由图1可知,这种减少的趋势并不太明显,到2008年,仍然有8.7%的论文存在这样的问题。

2.2 统计分析方法应用的合理性分析

2.2.1 总体合理性分析 统计分析的合理性是指统计分析时应用的统计方法的合理性,统计分析合理率为24.5%,不合理率58.4%,不明确率占15.6%,说明2000-2008年的统计方法应用状况并不乐观。

2.2.2 各统计分析方法应用的合理性分析 各统计分析方法(理论统计)应用的合理性如图2所示。

经x2检验,各实验设计方法统计分析合理性不同(x2=27.483,P=0.001<0.05)。由图1可知,t检验、单因素方差分析统计分析合理率>不合理率>不明确率;多因素方差分析、重复测量方差分析、前后测量统计的统计分析不合理率>不明确率>合理率。可以发现,基本统计分析方法统计合理率比高级统计分析平均高出41.8%;然而其统计分析不合理率却比高级统计分析平均低33.9%。这一现象说明了高级统计方法应用合理率严重偏低,基本统计分析方法应用的合理率有待进一步提高。

表2 2000-2008年“无方法适用性检验”状况一览表

表3 逐年t检验误用状况一览表

图3 统计合理性逐年变化趋势图

2.2.3 逐年统计分析合理性分析 2000-2008年的统计分析合理率、不合理率、不明确率的变化趋势见图3。

x2检验表明,2000-2008年的统计分析合理性变化没有统计显著性(x2=23.919,P=0.091>0.05)。由于P值接近显著性水平0.05,结合图3,仍然可以做出以下判断:不合理率曲线基本呈水平,基本没有变化;合理率曲线有上升趋势;不明确率曲线有下降趋势。2000-2008年,不合理率始终比合理率、不明确率高很多。

2.3 体育科学统计分析应用中存在的问题

2.3.1 无方法适用性检验 “无方法适用性检验”就是说论文中没有对统计方法适用性进行统计检验。2000-2008年“无方法适用性检验”状况见表2。

经x2检验,2000-2008年“无方法适用性检验”状况无显著性变化(Fisher精确检验值为 7.956,P=0.341>0.05)。在602篇有效统计论文中,有96.5%的论文没有介绍相应统计方法的适用性检验。这种无视统计方法适用性的问题会很大地影响论文的质量甚至体育科研水平。2000-2008年,高达95.1%的论文没有统计方法适用性的描述,足可以说明,体育科学实验研究中,存在着严重的“忽视”统计方法适用性的问题。

2.3.2 t检验、单因素方差分析的误用 t检验误用的问题很多体育科研学者都曾经提出过[5-8],也是长时间以来,体育科学研究中统计方法应用方面存在的一个很大的问题。使用单因素方差分析代替多因素方差分析或重复测量方差分析跟前面所讲的t检验误用所犯的错误类似,都包括导致Ⅰ类错误升高、无视重测资料数据相关性等。本调查中,使用过t检验的有306篇论文,其中233篇(76.1%)有误用现象;存在单因素方差分析代替多因素方差分析的有91篇,由于基数较少,不再进行逐年分析。2000-2008年t检验应用状况如表3。

经x2检验,2000-2008年t检验应用状况没有显著性变化(x2=8.983,P=0.344>0.05)。2008年t检验误用率(64.9%)达到最低,但从此以后是否仍有继续下降趋势还需后续调查。

调查可知,2000-2008年t检验误用频率由高到低依次为t检验代替重复测量方差分析(34.8%)、t检验代替前后测量方差分析(27.0%)、t检验代替单因素方差分析(18.5%)、t检验代替多因素方差分析(13.7%)、数据无可比性用t检验(6.0%)。可见,在体育科学研究中,t检验误用状况一直很严重,重复测量设计(任何实验设计经过指标的重测都可以转化为重复测量设计)中,t检验误用率最高。

2.3.3 实验前分组合理性证明 实验前各组非实验因素的均衡一致是组间具有可比性的前提条件之一。大多数研究者采用随机方法将研究对象分为若干组别,虽然是“随机”分组,但是,分组效果如何?随机误差有没有可能影响实验结果?这些问题都需要实验前对组间均衡性进行科学的论证,也就是实验前分组合理性的证明。本调查中,478篇(非单组设计)实验性研究论文中,有400篇(83.7%)没有实验前的分组合理性证明。由此可见,体育科学实验研究性论文中,大多数研究者没有对实验前分组的合理性给予足够的重视,毫无疑问,这会影响体育研究的科学性。

3 结论与建议

3.1 结 论

3.1.1 t检验、单因素方差分析应用率较高,复杂统计分析方法应用率偏低;复杂统计分析方法应用率逐渐增多,简单统计分析方法应用率逐渐减少。

3.1.2 统计分析合理率稍有上升,但是,合理率仍然较低。

3.1.3 统计分析误用状况有所减少,但是仍然较为严重,具体体现在:缺乏统计方法适应性检验;t检验误用率一直较高;缺乏实验前分组合理性证明等。

3.2 建 议

3.2.1 加强体育统计学科建设 体育统计作为一门学科,随着体育学科、体育技术的发展,体育统计作为一门应用性学科愈发显得其重要地位。目前,我国体育统计教学还有许多问题值得商榷。例如,不同学校课时安排差异很大,到底安排多少课时为宜,还缺乏科学的论证;本科与研究生体育统计教学如何有效衔接、教材如何配套;随着统计软件的使用,是否应该增设、如何增设体育统计应用实践课;作为统计教材如何进一步完善,对于常用的抽样分布定理、F分布、t分布的定义教材中为什么没有体现等等,这些问题还有待于进一步研究解决。

3.2.2 同等重视体育统计的“原理”和“应用” 随着统计软件在体育统计中的应用,出现了轻原理重应用的现象,统计误用的根本原因是对统计的相关原理掌握不清,正确的应用需要建立在正确掌握原理基础之上的。例如,简单统计方法中的t检验,存在着套用公式和决策时套用判断标准的问题,使用前对数据是否服从正态分布、是相关还是独立样本、总体方差是否相等等问题缺乏检验;再如,假设检验的实质是区分数据差异是抽样误差还是条件误差引起的,所以在实验前就必须把抽样误差降到最小,就必须对实验分组的合理性进行确切的说明。诸如此类的问题,在实际运用中必需理清各种统计方法的原理和使用条件。

3.2.3 加强体育统计方法使用的融合与借鉴 体育统计这一学科本身就是体育与统计学的融合,在使用统计方法时就必须考虑其使用条件,需要更多的统计知识融合到体育实践应用中来,才能进一步解决实践中各种复杂问题。通过调查发现,体育科学实验研究中,研究者应用复杂或较复杂的统计方法的频率逐渐增多,这表明体育科学实验研究统计应用方面正在不断的进步当中。同时,还可以借鉴经济学、医学、生物学等学科的研究成果与统计方法的选择和使用,防止“错误再错误”现象。

[ 1 ]张文彤.SPSS统计分析高级教程[M].北京:高等教育出版社,2006.

[ 2 ]戴龙基,张其苏,蔡荣华.中文核心期刊要目总览[M].北京:北京大学出版社,2000.

[ 3 ]戴龙基,蔡荣华.中文核心期刊要目总览[M].北京:北京大学出版社,2004.

[ 4 ]朱强,戴龙基,蔡荣华.中文核心期刊要目总览[M].北京:北京大学出版社,2008.

[ 5 ]郭璐.体育科学实验设计误区[ J ].北京体育大学学报,2006,29(12):1596-1599.

[ 6 ]马国东.体育科研中统计方法应用的几个问题[ J ].吉林体育学院学报,2006,22(4):150-151.

[ 7 ]周素华,陆云霞.t检验和x2检验常见误用辨析[ J ].公共卫生与预防医学,2007,18(2):110-112.

[ 8 ]孙芝娟.正确选用体育统计方法的若干思考[ J ].体育成人教育刊,2006,22(2):49-50.

猜你喜欢
适用性科学实验合理性
复合式装备适用性评估过程研究
强调简洁和适用性 MICHI by Rotel X5/X3合并功放
碰撞合理性问题的“另类”解决方法
无人潜航器作战保障适用性评估方法
奇遇
如何提高学具在数学教学中的适用性
关于用逐差法计算纸带加速度合理性的讨论
中国首颗微重力科学实验卫星升空
量子力学:从原理到应用--深度解读中国首颗量子科学实验卫星
小小科学实验