儿童少年体质场地测试手段的信度研究:系统评价

2011-01-02 04:28杨贤罡胡志刚李燕春
体育科学 2011年11期
关键词:握力信度体质

杨贤罡,胡志刚,李燕春,于 洋

儿童少年体质场地测试手段的信度研究:系统评价

杨贤罡1,2,胡志刚3,李燕春2,于 洋4

目的:系统评价现有针对儿童少年人群体质的场地测试手段的信度水平,形成场地测试手段信度水平的综合框架。方法:制定文献检索策略,检索1990年1月~2011年7月公开发表的英文全文文献,根据受试者、重复测试时间间隔、统计方法和研究结果,对纳入文献进行质量评估,根据研究数量和研究结果的一致性确定各场地测试手段信度的证据等级。结果:最终纳入31项高质量研究,其中涉及心肺能力最常见的手段是20 m折返跑、1英里跑/走和Andersen测试;涉及肌肉能力最常见的手段是握力,俯卧撑,纵跳,引体向上,屈臂悬挂,坐位体前屈,背力,屈膝两头起,仰卧起坐和立定跳远;涉及运动能力最常见的测试手段是4×10 m往返跑和30 m冲刺跑;涉及身体成分最常见的测试手段是人体测量学和通过皮褶厚度推算的体脂百分比。结论:尽管某些场地测试手段的信度水平需要进一步补充研究,基于目前的证据等级提出了针对儿童少年体质场地测试手段信度水平框架。

儿童少年;体质;场地测试;信度

前言

青春期高水平的心肺能力与成年后更为健康的心血管能力相关,而肌肉力量的提高与总肥胖水平的变化呈负相关,更为健康的身体成分水平与成年后更为健康的心血管能力,较低的死亡风险相关[45],突出了从较早时期开始严格测量和评价体质水平的重要性。

体质水平可以在实验室内进行客观和准确地评价,但在大样本的群体体质研究中实施并不可行,而场地测试手段是可供选择的替代手段。过去20年中,国内外出现了大量针对儿童少年体质的场地测试手段。在选择场地测试手段时,其信效度是考虑的首要问题,其中,信度是同一个体进行同一测试多次结果的再现性,即同一个体在两种场合中,极为接近的相同条件下做同一测试,应该得到相似的结果。体质场地测试方法的信度包括三种重要类型:重复测试间的相关性,重复测试间的差异和受试者内部的变异[24]。重复测试间的相关性是最常见的信度类型,反映受试者首次测试结果的等级排序在随后测试中的重复性。重复测试间的差异包括系统偏差和随机误差,反映重复测试结果之间是否具有显著差异。受试者内部变异则被认为是体育科学研究中最重要的信度类型。

本研究主要针对儿童少年体质场地测试手段的信度问题,将为该人群提供一个基于证据等级水平得出的体质场地测试手段综合框架,为将来的基础研究和实践应用提供参考。

1 研究对象与方法

1.1 研究对象

公开发表的针对儿童少年体质场地测试手段的信度研究。主要提取受试者(包括性别、年龄和例数)、场地测试手段、研究设计(重复测试,不同测试者间信度和测试者内部信度)、统计方法和研究结果方面的信息。

1.2 研究方法

1.2.1 国外体质的定义

从研究的内容和目的来看,国外的“Physical Fitness/ Fitness”与我国的体质概念相对应,主要包括心肺能力、肌肉能力、运动能力和身体成分四大元素。心肺能力主要反映心血管和呼吸系统维持体力活动进行氧气供应总体的工作能力。肌肉能力主要反映骨骼肌系统的力量、耐力、爆发力和柔韧性等方面的能力。运动能力主要包括速度、敏捷、协调和平衡能力。体成分主要包括身高、体重、围度、皮褶厚度以及相应派生指标(包括BM I和由皮褶厚度推算的体脂百分比)。

1.2.2 文献检索

在Medline、Embase、Highw ire、PubMed、Scopus和Sports Discus六大电子数据库中进行文献检索,检索关键词从“信度”和“体质”两方面进行组合检索[4]。检索时间限定为1990年1月—2011年7月,语种限制为英文的全文文献,通过参考文献采用追溯的方法以保证查全。研究对象界定为儿童和少年(0~18岁),无受伤,无身体或精神疾病等情况。

1.2.3 质量评估

2名经验丰富的评价者独立评价各纳入文献(作者1和2)。采用信度研究的质量评估量表对纳入文献的质量进行评分[13],包括受试者,重复测试时间间隔,研究结果和统计手段4个条目,每一条目被赋予0~2分(2分为最高分),纳入文献的质量评分最高为8分。质量评估总分分为3级,高质量为6~8分,低质量为2~5分,极低质量为0~1分。各条目详细评分标准如下:

1.受试者:受试者少于10人的研究被排除。受试者包括年龄、性别、体质或人体测量学测量信息在内的,被评为1分;研究未达到上述标准的被评为0分;当包括生长发育状态或种族等其他信息时,被评为2分。

2.重复测试时间间隔:根据多次试验间隔时间信息的正确性进行评分。给出正确和完整描述的研究被评为2分;间隔时间未知的研究被评为0分,提供信息模糊或不准确的研究被评为1分。

3.研究结果:提供两次测量结果和差值的研究被评为2分;仅描述2次测量结果或测量间差值的研究被评为1分;提供少于上述信息的研究被评为0分。

4.统计方法[18]:针对重复测试间的相关性的统计方法,最常见的是皮尔逊相关系数(Pearson’s correlation coefficient,r)和同类相关系数(Intra-class Correlation Coefficient, ICC)。r主要依赖于样本的测量值范围,个体间变异程度高会增加相关性,且r不能反映系统误差。ICC能同时反映系统误差和随机误差,是全面综合评价一致性的合适方法。一般推荐ICC在信度研究中应被采用,但不能仅仅只采用ICC,因为其同样易受到测量值范围的影响,高度相关性的同时可能存在无法接受的测量误差。另外,ICC不能反映与测量样本相一致的变异情况,随着测量次数的增加或减少,重复测试间的变异增加,数据被认为存在方差不齐,而这一问题在体育运动领域的信度研究中很少提及。

针对重复测量间的差异,主要采用配对统计(t检验,符号秩和检验)或重复测量的方差分析来观察重复测试结果之间是否具有显著性差异,在信度研究中能提供非常重要的信息。

关于受试者内部变异的统计方法,用变异系数(Coefficient of variation,CV)表示的典型误差不依赖于样本量的大小,而且,它是应用于研究信度问题提出较早的概念,而一致性界限则不需假设方差不齐是否存在。由于CV能反映测量随机误差,但不能反映系统误差,采用一致性界限的Bland-Altman法能通过图形直观地显示测量误差(包括系统误差和随机误差),还能确定是否存在方差不齐。

仅使用相关分析的研究被排除。仅采用CV的研究被评为0分;采用相关分析,加上除配对统计,重复测量的方差分析和Bland-Altman法3种以外统计方法的研究被评为1分;使用配对统计、重复测量的方差分析和Bland-A ltman法3种方法中至少一项的被评为2分。

1.2.4 证据等级评价

体质场地测试方法信度的证据等级分为三级[8]:

1.证据充分:存在3项或以上,结果一致的高质量研究;

2.证据中等:存在2项,结果一致的高质量研究;

3.证据有限或存在争议:结果一致,但来自于多项低或极低质量研究,或存在多项研究但结果不一致,或结果仅来自于一项研究。

2 结果

共检索到62项关于儿童少年体质场地测试手段的信度研究,其中18项研究因受试者少于10人或仅使用相关统计方法被排除。纳入分析的44项研究中,其中31项被评为高质量(占70%),13项被评为低质量(占30%),无极低质量研究。2名评价者的总一致性在85%(kappa= 0.83),不一致的通过共同商讨最终确定。纳入分析各项研究的质量评分详见表1。

纳入文献中涉及心肺能力的有12项高质量研究,最常见的测试手段是20 m折返跑(8项)、1英里跑/走(5项)和Andersen测试(2项);涉及肌肉能力的有15项高质量研究,最常见的测试手段是握力(7项),俯卧撑(3项),纵跳(2项),引体向上(4项),屈臂悬挂(3项),坐位体前屈(2项),背力(3项),屈膝两头起(2项),仰卧起坐(3项)和立定跳远(2项);涉及运动能力的有5项高质量研究,最常见的测试手段是4×10 m往返跑(2项)和30 m跑(3项);涉及身体成分的有8项高质量研究,最常见的测试手段是人体测量学(5项)和通过皮褶厚度推算的体脂百分比(3项)。

ICC是使用频率最高的统计手段(26项,占59%),其次是方差分析(16项,占36%)和Bland-A ltman方法(12项,占27%)。纳入分析的各项研究结果均以持续变量输出,但研究结果根据已建立的分界点以分类变量的形式输出时(例如根据FITNESSGRAM体质评价标准将受试者划分为达到或未达到“健康体质区域”),重复测试间的信度采用一致性比例(Percent/proportion of agreement,Pa)(10项,占23%)和kappa值(9项,占20%)进行分析。

表1 儿童少年体质场地测试手段信度高质量研究的质量评估一览表

3 分析与讨论

3.1 心肺能力

涉及心肺能力场地测试手段的信度研究,最多的是20 m往返跑。8~18岁儿童少年20 m折返跑的ICC在0.78~0.93之间[7,22,25,26,39]。一般认为,ICC在0.7~0.8之间表示信度可疑,>0.9被认为信度高,~1表明信度非常好,但是,比较不同研究的ICC需要谨慎对待[5,13]。8~15岁儿童少年20 m折返跑重复测试间无显著差异[22,39]。123名少年(13.6岁)20 m折返跑重复测量间无显著差异,差异均值男孩为-0.1±1.5级,女孩为0.0±1.1级,且无方差不齐[35]。España-Romero的研究针对58名儿童(6~11.9岁)和80名少年(12~18岁)的研究结果与前者完全一致,差异均值为0.05±1.0级[10]。Mo rrow研究了20m往返跑基于FITNESSGRAM体质标准评价结果的信度,体育教师和体质专家重复测试间的Pa分别为0.82和0.95,Kappa值分别为0.64和0.90[31]。另外2项针对Andersen测试信度的研究结果相一致。Ahler的研究针对35名儿童(6~9岁)的Andersen测试重复测试间无显著差异,r2=0.86,CV=2.6%,一致性界限为±68m[2]。29名男孩和28名女孩(10.4岁)Andersen测试的R=0.84,重复测试间无显著差异,差异均值为15±61m,且无方差不齐[3]。

针对1英里跑/走的信度研究中,5~18岁儿童少年1英里跑/走的ICC在0.39~0.90之间[7,41]。基于FITNESSGRAM体质标准的重复测试间Pa为0.66~0.97,但kappa值为0.33~0.94[7,25,26],提示分类连续变量在研究者间一致性或方法学比较的研究中还存在局限性[43]。但Morrow的研究采用相同方法,Pa=0.92,Kappa=0.84[31]。

其他信度研究中涉及心肺能力的测试手段包括6 min步行,5 min跑,15 m往返跑,Yo-Yo和Cooper测试。23名男孩和29名女孩(14.2岁)6 min步行的ICC=0.94,重复测试间无显著差异,差异均值为15 m,一致性界限在-35~65 m[21]。45名男女孩(17岁)5 min跑的最大有氧速度在第3次和第4次测试时显著高于第1次和第2次,4次测试的总CV=3.7%,当排除第1次测试结果后CV降到3.1%,仅考虑第3次和第4次测试结果时,CV下降到2.4%[48]。因此,推荐在正式测试前进行2次热身尝试,以获得最佳成绩。15 m往返跑基于FITNESSGRAM体质标准体育教师重复测试间的Pa=0.81,Kappa=0.62[31]。改进型Yo-Yo IR1测试(2×16 m)重复测试间无显著差异,r2=0.79,CV=19%,一致性界限为±354 m[1]。简化版Cooper测试(6 min)的ICC=0.72,SE=66.06[14]。

3.2 肌肉能力

肌肉能力场地测试手段信度研究最多的是握力,其中5项是针对6~18岁的儿童少年,肘关节完全伸直,使用TKK握力计进行的[11,35,44]。通过性别和年龄构建的公式,精准地调节握力计的抓握间距使其与受试者手的尺寸相适应,握力的信度系数为0.96~0.98,且重复测试间无显著差异[11,44]。Ortega的研究报道了使用TKK握力计进行握力的重复测试间无显著差异,差异均值男孩为0.3± 2.5 kg,女孩为0.0±1.8 kg,无方差不齐[35]。España-Romero[10]的研究同样使用TKK握力计,研究结果与前者一致,差异均值为0.10±4.0 kg。同时选择Jamar,DynEx和TKK三种握力计,重复测试间均无显著差异,但差异均值分别为0.23,0.26和0.02,一致性限度分别为1.20,1.42和1.57,均无方差不齐,提示使用TKK握力计测量最大握力的结果似乎最为可信[12]。12岁以下儿童采用Lode和Martin握力计测试,握力的ICC>0.84,差异均值均匀分布在0左右,但一致性界限与最大值的比值大于25%,且存在方差不齐[25]。Svensson使用Grippit握力计测试得出最大握力的ICC为0.97~0.98,CV为6.9%~8.6%,但重复测试间具有显著差异;同时10 s静态握力的ICC为0.95~0.97,CV为8.3%~11.4%,认为最大握力峰值和持续握力的重复测试信度均好,但推荐进行3次尝试,以获得最佳的测试信度[47]。

共有3项针对俯卧撑的信度研究。90°俯卧撑的ICC男孩=0.90,女孩=0.93,但重复测试间均具有显著差异,差异均值男孩为2.7±5.0次,女孩为2.3±3.5次。CV男孩=15.3%,女孩=21.4%[24]。俯卧撑基于FITNESSGRAM体质标准,体育教师重复测试间的Pa=0.74,Kappa=0.48,体质专家的Pa=0.77,Kappa=0.54[31]。俯卧撑的重复测试信度系数,男孩=0.83,女孩=0.71[36]。

关于纵跳的信度研究,需要注意国外纵跳与国内的测试内容有所区别[35]。L loyd[23]蹲跳测试的ICC=0.82,CV =8.64%,但重复测试间具有显著差异,第2,3次的高度显著低于第1次。反向跳测试的ICC=0.62,CV= 12.88%,但重复测试间无显著差异,各次测试结果一致性很好,被认为是可信的测试方法。而Ortega的研究中蹲跳和反向跳的重复测试间无显著差异,差异均值蹲跳男孩为-0.5±3.3 cm,女孩为-0.8±3.0 cm,反向跳男孩为-0.0±3.4 cm,女孩为0.4±3.3 cm,均无方差不齐。纵跳(类似于国内的纵跳)差异均值,男孩为0.0±4.0 cm,女孩为-0.4±3.6 cm,重复测试间无显著差异,无方差不齐[35]。

引体向上经常被用于评价肌肉耐力,共4项研究评价了其信度[9,20,42,36],其中2项仅采用ICC,Pa和Kappa值作为信度指标[20,42]。171名男孩和192名女孩(4~12岁)中,由于某些年龄组的重复测量间存在显著差异,建议为获得可靠的测试结果,有必要对男孩进行2次测试,女孩则无此要求[9]。Pate的研究中3种引体向上测试的重复测试信度系数,男孩分别为0.80、0.83和0.81,女孩为0.66、0.85和0.88[36]。由于各种改进型引体向上测试存在差异,因此,比较不同研究的结果同样需要谨慎。屈臂悬挂与引起向上相似。屈臂悬垂的重复测试信度系数男孩为0.90,女孩为0.85[36]。123名少年(13.6岁)的重复测量间无显著差异,差异均值男孩为-0.7±13.9 s,女孩为0.0±16.3 s,但存在方差不齐[35]。基于FITNESSGRAM体质标准重复测试间的Pa=0.82,Kappa=0.64[31]。

针对坐位体前屈的信度研究中,87名男孩和92名女孩(6~12岁)的ICC为0.96~0.99[17]。改进型坐位体前屈基于FITNESSGRAM体质标准重复测试间的Pa男孩为0.81,女孩为0.91,Kappa男孩为0.62,女孩为0.82[17]。123名少年(13.6岁)改良型坐位体前屈的重复测量结果间无显著差异,差异均值男孩为-0.3±3.6 cm,女孩为1.4±4.9 cm,但存在方差不齐[35]。

针对背力的信度研究有3项。88名少年(11~15岁)背力的ICC值为0.85~0.98,Pa和Kappa分别为0.93~1.0和0.86~1.0[38]。基于FITNESSGRAM体质标准体育教师重复测量间的Pa=0.89,Kappa=0.72,体质专家的Pa=0.78,Kappa=0.56[31]。40名男孩和32名女孩(14~18岁)的背力重复测试间无显著差异[16]。

有2项针对屈膝两头起的信度研究。针对84名男女孩(10~12岁)进行的测试者间信度研究中,儿童登记的得分显著高于教师登记得分[37]。基于FITNESSGRAM体质标准体育教师重复测量间的Pa=0.78,Kappa=0.56;体质专家的Pa=0.87,Kappa=0.74[31]。

针对仰卧起坐的信度研究有3项。94名少年(12.7岁)半仰卧起坐的ICC=0.95~0.97,但重复测量结果间存在显著差异[40]。7级仰卧起座的ICC男孩为0.96,女孩为0.91。重复测试间均无显著差异,差异均值男孩为0.0 ±0.9级,女孩为0.3±0.9级。CV男孩为12.5%,女孩为17.1%[24]。改进型仰卧起坐基于FITNESSGRAM体质标准体育教师重复测试间的Pa=0.89,Kappa=0.78,体质专家的Pa=0.86,Kappa=0.72[31]。但对比上述3项研究,仰卧起坐的测试方法间存在较大差异。

涉及立定跳远的信度研究同样有3项。24名儿童(8.6岁)立定跳远的ICC=0.88[14]。69名男孩和53名女孩(13.6岁)立定跳远重复测试间无显著差异,差异均值男孩为-0.3±12.9 cm,女孩为0.3±9.0 cm,且无方差不齐[35]。España-Romero[10]的研究得出相同结果,差异均值为0.33±13.4 cm。

其他涉及肌肉能力的信度研究涉及动态躯干90°伸展、靠墙蹲立、单腿和单腿跳跃(7 m)、单手掷网球、双手推实心球和攀爬墙栏。40名男孩和32名女孩(14~18岁)动态躯干90°伸展重复测量结果间存在显著差异[16]。Lubans的研究中靠墙蹲立时间的ICC男孩为0.88,女孩为0.69。重复测试间男孩具有而女孩无显著差异,差异均值男孩为7.8±17.4 s,女孩为3.3±17.9 s。CV男孩为26.5%,而女孩中存在方差不齐[24]。FjØrtoft的研究中双腿跳跃ICC=0.65,SE=0.40;单腿跳跃ICC=0.66,SE= 0.23;单手掷网球ICC=0.92,SE=0.99;双手推实心球ICC=0.54,SE=0.34;攀爬墙栏ICC=0.77,SE= 1.41[14]。

3.3 运动能力

针对平衡能力的信度研究包括单腿站立和倾斜平衡板,两项测试分别在闭眼和开眼两种状态下进行,24名(4~9岁)男女孩仅在闭眼倾斜平衡板的重复测试中倾斜角度显著增加29.6°,其余组内和组间比较均无显著性差异[6]。

针对速度和敏捷能力结合的信度研究包括4×10 m折返跑和10×5 m往返跑。4×10 m折返跑重复测试结果间无显著差异,差异均值男孩为0.1±0.7 s,女孩为0.1 ±0.8 s,无方差不齐[35]。Vicente-Rodriguez研究了4×10 m往返跑测试者间的信度,受培训者与电计时之间并无显著差异,差异均值分别仅为0.01 s,一致性界限为-0.31~0.34,认为接受培训的测试者采用手动计时测试速度和敏捷素质信度良好[50]。24名儿童(8.6岁)10×5 m往返跑的ICC=0.69[14]。

针对协调能力测试的信度研究中,由于重复测量间无显著性差异,ICC分别为0.96和0.90,CV分别是2.3%和4.9%,因此,认为障碍和跨栏是可靠的测试手段,但受试者较少[2]。

针对速度素质的信度测试有3项。25 m跑的ICC= 0.91,重复测试间无显著差异,CV=3.7%[34]。30 m跑测试者间信度的研究中,受培训者与电计时之间并无显著差异,差异均值仅为-0.04 s,一致性界限为-0.51~0.43[50]。24名儿童(8.6岁)20 m跑的ICC=0.71[14]。

3.4 身体成分

通过皮褶厚度推算体脂百分比方法的信度研究中,21名男孩和22名女孩(9~11岁)中的ICC为0.99,重复测量间无显著差异,差异均值为0.13%,一致性界限为-1.74%~1.99%[15]。7~9岁儿童由双侧获得的皮褶厚度推算出的体脂百分比重复测量结果间无显著差异。尽管这些差异显著低于测量中的技术误差(technical erro r of measurement,TEM),但是,某些人体测量学参数左右侧间存在显著差异[30]。12岁左右儿童通过Slaughter皮褶公式推算的体脂百分比信度非常高,但该研究仅有14例受试者,且研究结果主要基于ICC[19]。

人体测量学的测量误差被认为无法避免,通常通过TEM进行研究。7~16岁儿童皮褶厚度的TEM小于1 mm,围度的TEM小于1 cm,两者的信度系数均大于95%,但存在方差不齐[29,33]。新生儿、婴儿和儿童中,一般测试者相比较专家趋向于低估长度、高度和手臂围度,而高估皮褶厚度[52]。West的研究观察了新生儿围度的TEM%均低于4.00%,皮褶厚度在2.88%~14.23%之间。围度的信度系数大多数在0.80~0.99之间,皮褶厚度则≥0.70,认为新生儿围度的测量是可信的,相比较围度,皮褶厚度的信度有一定程度的变异,但总体良好。2~7岁儿童身高和皮褶厚度的TEM一般测试者约为专家的2倍,人体测量学的知识积累和工作经验可以显著预测身高和三角肌皮褶厚度测量的精确度[49]。学校护士与受过培训的人员比较,5~12岁儿童体重和身高测量者间的差异分别是0.06 kg和0.34 cm,学校护士能提供更为可靠的BM I筛选结果[46]。然而,需要注意该研究中使用的统计方法含糊不清,仅列出差异均值和范围来衡量绝对差值。8~9岁儿童体重、身高、BM I和围度的ICC较高(0.95~0.99),皮褶厚度相对较低易波动(0.80~0.99),派生指标(如BM I)的测量准确度较原始指标低且易波动[32]。但BM I基于FITNESSGRAM体质标准体育教师和体质专家重复测量间的Pa分别为0.97和0.96,Kappa分别为0.94和0.92[31],提示,受过良好训练的测试者人体测量学测试结果的信度很高,与体质专家相当,是可以接受的。España-Romero[10]的研究包括身高、体重、皮褶厚度(三角肌和肩胛下位置)和腰围的信度,仅发现腰围重复测试间具有显著差异,差异均值为-0.56±1.0 cm,均无方差不齐。

4 结论

由于儿童少年体质场地测试手段的信度研究在研究设计和结果报道上缺乏一致性,且某些测试手段的效度还需进一步研究,因此,本研究的结果需要谨慎对待,同时需要指出,本研究中涉及的某些测试手段虽然可靠,但是,由于研究例数较少,导致其信度的证据等级有限。尽管存在一定的局限性,目前仍可以形成一个基于证据等级水平的儿童少年体质场地测试手段信度框架,详见图1。

图1 基于证据等级水平构建的儿童少年体质场地测试手段的信度框架图

[1]ANDERSEN L B,ANDERSEN T E,ANDERSEN E,et al.An intermitten t running test to estimate maximal oxygen up take: the Andersen test[J].J Spo rts Med Phys Fitn,2008,48:434-437.

[2]AHLER T,BENDIKSEN M,KRUSTRUP P,et al.Aerobic fitness testing in 6-to 9-year-old children:reliability and validity of a modified Yo-Yo IR1 test and the Andersen test[J].Eur JApp l Physiol,2011;published online ahead of p rint.

[3]ALRICSSON M,HARMS-RINGDAHL K,W ERNER S.Reliability of sports related functional tests with emphasis on speed and agility in young athletes[J].Scand J Med Sci Sports,2001, 11:229-232.

[4]ARTERO E G,ESPAÑA-ROMERO V,CASTRO-PIÑERO J,et al.Reliability of field-based fitness tests in youth[J].Int J Spo rts Med,2011,32:159-169.

[5]A TKINSON G,NEV ILL A M.Statisticalmethods for assessing measurement error(reliability)in variables relevant to sports medicine[J].Sports Med,1998,26:217-238.

[6]A TWA TER SW,CROWE T K,DEITZJ C,et al.Interrater and test-retest reliability of two pediatric balance tests[J].Phys T-her,1990,70:79-87.

[7]BEETSM W,PITETTIK H.Criterion-referenced reliability and equivalency between the PACER and 1-mile run/walk fo r high school students[J].Measur Phys Edu Exe Sci,2006,3:S21-S33.

[8]CASTRO-PINERO J,ARTERO E G,ESPANA-ROM ERO V,et al.Criterion-related validity of field-based fitness tests in youth: a system atic review[J].Br J Spo rts M ed,2010,44:934-943.

[9]COTTEN D J.An analysis of the NCYFS IImodified pull-up test[J].Res Q Exe Spo rt,1990;61:272-274.

[10]ESPAÑA-ROM ERO V,ARTERO E G,JIMENEZ-PAVON D,et al.Assessing health-related fitness tests in the school set-ting:reliability,feasibility and safety;the AL PHA Study[J]. In t J Spo rts M ed,2010,31(7):490-497.

[11]ESPAÑA-ROM ERO V,ARTERO E G,SANTAL IESTRAPASIASA M,et al.Hand span influences optimal grip span in boys and girls aged 6 to 12 years[J].J Hand Surg Am,2008, 33:378-384.

[12]ESPAÑA-ROM ERO V,ORTEGA F B,V ICENTE-RODRÍGUEZ G,et al.Elbow position affects handgrip strength in adolescents:validity and reliability of Jamar,DynEx,and TKK dynamometers[J].J Strength Cond Res,2010,24:272-277.

[13]ESSENDROPM,MAUL I,LAUBL I T,et al.Measures of low back function:a review of rep roducibility studies[J].Clin Biomech,2002,17:235-249.

[14]FJØRTOFT I,PEDERSEN A V,SIGM UNDSSON H,et al. Measuring physical fitness in children who are 5 to 12 yearsold with a test battery that is functional and easy to administer[J]. Phys Ther,2011,91:1087-1095.

[15]GUTIN B,L ITAKER M,ISLAM S,et al.Body composition measurement in 9-11-y-old children by dual-energy X-ray absorptiometry,skinfold-thicknessmeasurements,and bio-impedance analysis[J].Am J Clin Nut,1996,63:287-292.

[16]HANN IBAL N S,PLOWMAN SA,LOONEY M A,et al.Reliability and validity of low back strength/muscular endurance? eld tests in adolescents[J].J Phys Act Health,2006,3:S78-S89.

[17]HARTMAN J,LOONEY M.Norm-referenced and criterionreferenced reliability and validity of the back-saver sit-andreach[J].Meas Phys Edu Exe Sci,2003,7:71-87.

[18]HOPKINS W G,M ARSHALL SW,BA TTERHAM A M,et al.Progressive statistics fo r studies in spo rts medicine and exercise science[J].Med Sci Spo rts Exe,2009,(41):3-12.

[19]JANZ K F,N IELSEN D H,CASSADY SL,et al.Cross-validation of the Slaughter skinfold equations for children and adolescen ts[J].M ed Sci Spo rts Exe,1993,25:1070-1076.

[20]KOLLA TH J A,SA FR IT M J,ZHU W,et al.M easu rement erro rs in modified pull-ups testing[J].Res Q Exe Sport,1991, 62:432-435.

[21]L IA M,YIN J,YU C C,et al.The six-minute walk test in healthy children:reliability and validity[J].Eur Respir J,2005, 25:1057-1060.

[22]L IU N Y,PLOWMAN SA,LOONEYM A.The reliability and validity of the 20-meter shuttle test in American students 12 to 15 years old[J].Res Q Exe Sport,1992,63:360-365.

[23]LLOYD R S,OL IVER J L,HUGHES M G,et al.Reliability and validity of field-based measuresof leg stiffness and reactive strength index in youths[J].J Spo rts Sci,2009,27(14):1565-1573.

[24]LUBANSD R,MORGAN P,CALL ISTER R,et al.Test-retest reliability of a battery of field-based health-related fitness measures for adolescents[J].J Sports Sci,2011,29(7):685-693.

[25]M A HAR M T,PARKER C R,ROW E D A.A greemen t among threefield tests of aerobic capacity[J].Res Q Exe Spo rt,1997, 68:A-54.

[26]MAHAR M T,ROWED A,PARKER C R,et al.Criterion-referenced and norm-referenced agreement between the mile run/ walk and PACER[J].M eas Phys Edu Exe Sci,1997,1:245-258.

[27]MOLENAAR H M,ZU IDAM J M,SELLES R W,et al.Agespecific reliability of two grip-strength dynamometers w hen used by children[J].J Bone Joint Surg Am,2008,90:1053-1059.

[28]MOL ENAAR H M,KRA KER M D E,ZU IDAM J M,et al. V isual feedback and w eigh t reduction of a g rip strength dynamometer do not increase reliability in healthy children[J].J Hand Ther,2010,23(3):272-279.

[29]MORENO L A,JOYANESM,M ESANA M I,et al.Harmonization of anthropometric measurements for a multicenter nutrition survey in Spanish adolescents[J].Nut,2003,19:481-486.

[30]MORENO L A,RODRIGUEZ G,GU ILLEN J,et al.Anthropometric measurements in both sidesof the body in the assessment of nutritional status in pre-pubertal children[J].Eur J Clin Nut,2002,56:1208-1215.

[31]MORROW JR,MARTIN SB,JACKSON A W.Reliability and validity of the FITNESSGRAM:quality of teacher-collected health-related fitness surveillance data[J].Res Q Exe Spo rt, 2010,81(3 Suppl):S24-30.

[32]MUELLERW H,KAPLOW ITZ H J.The p recision of anthropometric assessment of body fat distribution in child ren[J]. A nn Hum Biol,1994,21:267-274.

[33]NAGY E,V ICENTE-RODRIGUEZ G,MAN IOS Y,et a l.Harmonization p rocess and reliability assessment of anthropometric measurements in a multicenter study in adolescents[J].Int J Obes(Lond),2008,32,Supp l 5:S58-S65.

[34]NGU YEN T,OBEID J,TIMMONS B W.Reliability of fitness measures in 3-to 5-year-old children[J].Pediatr Exe Sci,2011, 23(2):250-260.

[35]ORTEGA F B,ARTERO E G,RU IZ J R,et al.Reliability of health-related physicalfitness tests in European adolescents. The HELENA Study[J].Int JObes(Lond),2008,32 Suppl 5: S49-57.

[36]PA TE R R,BURGESS M L,WOODS J A,et a l.Validity of field tests of upper body muscular strength[J].Res Q Exe Spo rt,1993,64:17-24.

[37]PA TTERSON P,BENN INGTON J,DE LA ROSA T.Psychometric p roperties of child-and teacher-reported curl-up sco res in children ages 10-12 years[J].Res Q Exe Sport,2001,72: 117-124.

[38]PA TTERSON P,RETHW ISCH N,W IKSTEN D.Reliability of the trunk lift in high school boys and girls[J].Meas Phys Edu Exe Sci,1997,(1):145-151.

[39]PITETTI K H,FERNHALL B,FIGON IS.Comparing tw o regression fo rmulas that p redictO2peak using the 20-m shuttle run for children and adolescents[J].Ped Exe Sci,2002,(14): 125-134.

[40]PRITCHARD T,O’BRYAN T H.An alternative to the full situp testing for middle school students[J].Phys Edu,2001,58: 42-51.

[41]RIKL IR E,PETRAY C,BAUMGARTNER T A.The reliability of distance run tests fo r child ren in g rades K-4[J].Res Q Exe Sport,1992,63:270-276.

[42]ROMA IN B S,MA HAR M T.Norm-referenced and criterionreferenced reliability of the push-up and modified pull-up[J]. Meas Phys Edu Exe Sci,2001,5:67-80.

[43]ROTHWELL P M.Analysis of agreement between measurements of continuous variables:general p rincip les and lessons from studies of imaging of carotid stenosis[J].J Neurol,2000, 247:825-834.

[44]RU IZ J R,ESPANA-ROM ERO V,ORTEGA F B,et al.Hand span influences optimal grip span in male and female teenagers [J].J Hand Surg Am,2006,31:1367-1372.

[45]RU IZ J R,CASTRO-PIÑERO J,ARTERO E G,et al.Predictive validity of health-relatedfitness in youth:a systematic review[J].B r J Sports Med,2009,43:909-923.

[46]STODDARD S A,KUBIK M Y,SKA Y C.Is school-based height and w eight screening of elementary students p rivate and reliable?[J].J Sch Nu rs,2008,24:43-48.

[47]SVENSSON E,WAL ING K,HAGER-ROSS C.Grip strength in children:test-retest reliability using grippit[J].Acta Paediatr,2008,97(9):1226-1231.

[48]TONG T K,FU F H,CHOW B C.Reliability of a 5-min runningfield test and its accuracy inO2max evaluation[J].J Sports Med Phys Fitn,2001,41:318-323.

[49]VEGEL IN A L,BRU KX L J,WAEL KENSJ J,et al.Influence of know ledge,training and experience of observerson the reliability of anthropometric measurements in children[J].Ann Hum Biol,2003,30:65-79.

[50]V ICENTE-RODRIGUEZ G,REY-LOPEZ J P,RU IZ J R,et al.Interrater reliability and time measurement validity of speed-agility field tests in adolescents[J].J Strength Cond Res,2011,25(7):2059-2063.

[51]WEST J,MANCHESTER B,WRIGHT J,et al.Reliability of routine clinical measu rements of neonatal circum ferences and research measu rem ents of neonatal skinfold thicknesses:findings from the Bo rn in B radfo rd study[J].Paediatr Perinat Epidemiol,2011,25(2):164-171.

[52]WHO MULTICENTRE GROW TH REFERENCE STUDY GROUP.Reliability of anthropometric measurements in the WHO multicentre grow th reference study[J].Acta Paediatr Suppl,2006,450:38-46.

Reliability of Field-based Fitness Tests in Children and Adolescen ts:System Review

YANG Xian-gang1,2,HU Zhi-gang2,L I Yan-chun3,YU Yang4

Objective:To assess the reliability level of existing field-based fitness in children and adolescents,and form the overall framework of field-based fitness tests acco rding to levels of evidence.Method:Search related English full text document published from Jan.1990 to Jul. 2011,according to quality assessment criteria including the description of the participants,the time interval betw een measurements,the descrip tion of the results and the app rop riateness of statistics.Three levels of evidence were constructed acco rding to the number of studies and the consistency of the findings.Result:31 high quality studiesw ere finally analyzed,themost common tests to measure cardiorespiratory fitness were the 20m shuttle run,1 m ile run/w alk and Andersen test.Tests fo r musculoskeletal fitness were the handgrip strength,push-up,vertical jump,pull-up,bent arm hang,sit and reach,trunk lift,curl-up,sit-up and standing broad jump tests.Tests fo r assessing moto r fitness were 4×10m shuttle run and 30m dash.Tests fo r assessing body composition were anthropometric measurements and percentage body fat estimated from skinfold thickness.Conclusion:A lthough some fitness components warrant further investigation,this research p rovides an evidence-based p roposal for reliable framewo rk of field-based fitness tests fo r use w ith children and adolescents.

child ren and adolescents;fitness;filed-based test;reliability

G804.49

A

1000-677X(2011)11-0035-08

2011-09-15;

2011-10-25

河北省科学技术厅课题资助(07277115D,10277145)。

杨贤罡(1984-),男,安徽安庆人,助理研究员,在读博士研究生,研究方向为运动员基因选材及低氧训练,Tel: (0311)85266843,E-mail:yangxiangang9100@163.com;胡志刚(1984-),男,江西新余人,讲师,硕士,研究方向为体质测量与评价,Tel:(0791)88175117,E-mail:huzhigang-668@163.com;李燕春(1981-),女,湖南隆回人,讲师,在读博士研究生,研究方向为运动员基因选材, Tel:(010)62989306,E-mail:lych1216@163.com;于洋(1961-),女,辽宁抚顺人,教授,研究方向为特殊人群体育锻炼疗法机制,E-mail:yuyang5997@sina.com。

1.河北省体育科学研究所,河北石家庄050011;2.北京体育大学,北京100084;3.江西师范大学,江西南昌330022;4.沈阳体育学院,辽宁沈阳110102

1.Hebei Instituteof Sport Science,Shijiazhuang 050011, China;2.Beijing Sport University,Beijing 10084,China; 3.Jiangxi No rmal University,Nanchang 330022,China; 4.Shenyang Spo rt University,Shenyang 110102, China.

文章编号:1000-677X(2011)09-0003-16

猜你喜欢
握力信度体质
巧练握力益康寿
中医“体质”问答
中医“体质”问答
中医“体质”回答
平衡损失函数下具有两水平共同效应的信度模型
净保费在平衡损失函数下的回归信度估计∗
28天吃出易瘦体质
问卷是否可信
——基于体育核心期刊论文(2010—2018年)的系统分析
儿童握力弱,未来健康差
不容忽视的握力