Logistic回归与ROC曲线在甘肃省高校学生人群超重/肥胖筛查中的应用

2014-07-05 01:17宿荣荣
湖北体育科技 2014年3期
关键词:甘肃省高校学生人群

宿荣荣,徐 嘉

1 问题的提出

肥胖是一种常见的慢性代谢性疾病,2000年世界卫生组织已经将肥胖列为严重危害人类健康的流行病[1],大量研究证明,慢性疾病的发生与吸烟、大量饮酒、不科学合理膳食、缺乏身体锻炼以及精神因素等不良生活方式密切相关[2-3]。肥胖是糖尿病、高血压、冠心病与慢性疾病的主要危险因子,预防和控制肥胖已成为当今流行病学研究的热点问题[4]。随着我国经济的快速发展和社会进步,人民生活方式水平不断得到提高,膳食结构、生活方式发生了很大变化,大学生群体作为未来社会发展的时代先锋,他们的生活方式的变化反映着时代精神的变革。文明、健康、科学的生活方式是大学生走向成功的基本素质。肥胖作为慢性疾病的危险因子完全可以通过健康生活方式来控制。

2 研究对象与方法

2.1 调查对象

采用随机分层抽样方法,抽取甘肃省5所大学 (兰州大学、西北师范大学、兰州交通大学、兰州理工大学、兰州城市学院),每所学校随机抽取500人,要求学生不记名、真实、独立填写问卷,回收问卷后剔除16份无效问卷。有效回收问卷2 480份,有效回收率为99.2%,问卷的有效回收率符合统计学样本量的要求。

2.2 调查内容

参考有关资料,自行设计甘肃省高校学生人群超重/肥胖情况与生活方式关系问卷,随机抽取甘肃省5所高校2 500名大学生,要求填写2次问卷,间隔时间为2周,对2次得分进行相关性分析,相关系数为0.81(P<0.05)表明该问卷有较高信度。该问卷通过因子分析和专家评价后也获得到较高效度。问卷的调查内容包括5大部分:①基本信息、②体育锻炼生活方式、③饮食生活方式、④吸烟饮酒生活方式、⑤其他生活方式。

2.3 研究方法

2.3.1 文献资料法

根据本文研究内容和任务的需要,阅读了大量关于社会学、心理学、体育统计学、问卷统计分析、肥胖症等书籍,通过计算机中文数据库检索查阅了有关大学生超重/肥胖、大学生生活方式、生活方式与肥胖相关文献,为本文研究提供翔实理论依据。通过中国知网期刊数据库检索1990-2012年发表的中文文献,未见有将大学生生活方式与超重/肥胖关系进行模型预测的相关报道,在中国知网高级检索上利用“生活方式”、“大学生肥胖”、“肥胖模型预测”进行检索,未检索到1篇关于大学生超重/肥胖模型预测的相关文献。

2.3.2 超重/肥胖的诊断标准

采用体质指数(body mass index,BMI)由体重(kg)除以身高(m)的平方得出。根据美国CDC标准建议用第85百分位数和第95百分位数作为判定甘肃省高校学生人群超重/肥胖的标准。依照此标准甘肃省高校学生人群BMI≥22.86为超重,BMI≥24.61为肥胖[5]。本次研究将超重和肥胖合在一组进行分析[6]。

2.3.3 统计学方法

应用SPSS20.0社会学统计软件进行分析,组间比较用卡方检验,将差异有统计学意义的生活方式指标运用二分类变量Logistic回归模型(Binary Logistic)进行分析,以找出影响甘肃省高校学生人群肥胖生活方式的危险因子和保护因子,利用ROC曲线对这些指标的诊断值进行分析,对样本进行预测,并以实际结果进行对比分析,以评估预测的准确度。两曲线下面积的比较采用Z检验[7-8]。

3 结果与分析

3.1 单因素分析

单因素分析显示性别(X2=13.976,P=0.000)、年龄(X2=15.786,P=0.000)、运动时间(X2=23.488,P=0.000)、是否吃早餐 (X2=12.362,P=0.009)、 是否经常吃夜宵 (X2=34.718,P=0.000)、是否经常吃零食(X2=48.664,P=0.000)、吃饭速度(X2=13.976,P=0.000)、几天至少喝过一杯酒(X2=9.423,P=0.024)、静坐时间(X2=12.109,P=0.007)与甘肃省高校学生人群超重/肥胖有统计学上显著的相关性。(P<0.05)。

3.2 危险因素分析

经多因素Logistic回归分析,共有5个指标进入最终模型,是否经常吃零食和吃饭速度是甘肃省高校学生人群超重/肥胖的保护性因素,而年龄、否吃夜宵和每天静坐时间是甘肃省高校学生人群超重/肥胖的危险性因素。具体结果见表1:

表1 甘肃省高校学生人群超重/肥胖的多元Logistic分析结果

3.3 ROC曲线分析

以甘肃省高校学生人群非肥胖组为对照组,对年龄、是否经常吃零食、吃饭速度、是否吃夜宵、每天静坐时间5个指标绘制ROC曲线并检测每个指标的灵敏度和特异度,具体结果见表2:

表2 5个检测指标的曲线下面积

对5个指标曲线下的面积采用Z检验进行两两比较,结果显示差异均无统计学意义(P>0.05),利用5个指标组成的Logistic 回归模型 P=1/[1+e-(1.393+0.703×年龄-0.940×是否经常吃零食-2.636×吃饭速度+0.709×是否经常吃夜宵+0.555×每天静坐时间)]对样本进行回代,若P≥0.5则判断为肥胖,若P<0.5则判断为非肥胖,得到的综合预测模型的灵敏度为84.07%,特异度为75.9%,诊断符合率为81.18%。

4 讨论

肥胖已在全球范围内广泛流行,1999年WHO已正式宣布肥胖是一种疾病[9]。近年来研究表明,超重以及后期肥胖的发生会带来许多负性的健康效应[10]。随着我国居民生活水平提高,生活方式行为的改变,慢性疾病已成为严重影响人群健康,制约社会发展的主要社会问题。肥胖作为这些慢性疾病的危险因素是完全可以通过健康的生活方式来控制的。

在医学领域中,“机器学习”是近年来兴起的重要数据挖掘工具,通过对大量数据的分析寻找有价值的信息,利用这些诊断信息资料建立预测系统为实践操作提供决策依据,如图像识别、疾病辅助诊断、疾病风险预测[11-12]。根据这一理论依据,探讨机器学习用于大学生超重/肥胖筛查和辅助诊断,对于促进大学生超重/肥胖预防措施制定提供参考,提高大学生自觉形成健康、科学生活方式,减少大学生超重/肥胖的漏诊和误诊都具有十分积极的现实意义。

本研究采用卡方检验对大学生生活方式因素进行筛选,得到9个指标(性别、年龄、运动时间、是否吃早餐、是否经常吃夜宵、是否经常吃零食、吃饭速度、几天至少喝过一杯酒、每天静坐时间)对甘肃省高校学生人群超重/肥胖发生影响并且在统计学上有显著意义的指标。采用多元Logistic回归对这9个指标再进行筛选,得到“年龄、是否经常吃零食、吃饭速度、是否经常吃夜宵、每天静坐时间”5个指标对甘肃省高校学生人群超重/肥胖发生影响并且在统计学上有显著意义的指标。5个指标的曲线下面积均在0.66以上[13],说明用于筛查甘肃省高校学生人群超重/肥胖的诊断性较好,从绘制的ROC曲线可以看出,代表是否经常吃零食和吃饭速度的两条曲线位于对角线的下方,而代表年龄、是否经常吃夜宵和每天静坐时间的三条曲线位于对角线上方,这说明前两项指标与后三项指标对甘肃省高校学生人群超重/肥胖的影响作用是相反的,这也与所建立的Logistic回归模型中变量系数的正负号相一致。从OR值得大小可以看出,是否经常吃零食和吃饭速度的OR值均小于1,表明二者是甘肃省高校学生人群超重/肥胖的的保护因子,年龄、是否经常吃夜宵和每天静坐时间的OR值均大于1,说明三者是甘肃省高校学生人群超重/肥胖的的危险因子。根据这5个指标可以独立对大学生发生超重/肥胖风险进行评估,但是诊断分析结果显示4个独立生活方式指标预测均存在特异度偏低情况,即4(年龄、是否经常吃零食、是否经常吃夜宵、每天静坐时间)个独立生活指标对排除超重/肥胖大学生的能力较低。5个综合生活方式指标组成的Logistic回归模型预测有较高灵敏度(84.07%)、特异度(75.90%)和诊断符合率(81.18%),这说明5个综合生活方式指标对发现大学生超重/肥胖合排除大学生超重/肥胖的能力均较高,预测结果也较为理想。大学生通过日常生活行为方式进行超重/肥胖的预测,这样不仅降低了学校医务人员的工作量,同时也提高了每位大学生自觉积极干预降低自身超重/肥胖发生风险的能力。在不增加每位大学生经济负担的情况下,提高了大学生超重/肥胖人群的检出率。

利用统计学方法建立的预测模型是根据每位大学生日常生活方式指标得分多少对诊断结果进行概率推断,是近年来医学界兴起的一种重要的辅助诊断工具,符合现代循证医学理念且操作非常简便,有利于大规模推广。其计算原理是建立在概率论的基础上,因此结论只是概率性的,只是作为诊断大学生超重/肥胖发生的辅助工具,并不能代替必要的医学确诊性检查。但是大学生超重/肥胖模型预测不仅可以提高大学生自觉形成科学健康生活方式,而且可以提高每位大学生自觉积极干预降低自身超重/肥胖发生风险的能力。随着健康营养医学研究的不断深入,所建立的预测模型不断完善,预测结果的准确性将越来越高,对大学生通过日常生活方式自觉干预降低自身超重/肥胖发生风险的指导意义将更大。

[1]刘学哲.肥胖的研究现状及展望[J].体育科技文献通报,2009,17(2):113.

[2]胡祥炬,林曙光,钟文玲,等.福建省5个国家疾病监测点成人超重肥胖的影响因素分析[J].中华疾病控制杂志,2013,17(1):20-23.

[3]邵永强,王 建,钱合笑,等.温州市35岁以上居民超重肥胖症及其影响因素调查[J].疾病监测,2010,25(11):900-903.

[4]姜 勇,张 梅,李溢冲,等.中国慢性病及危险因素监测报告[M].北京:人民卫生出版社,2007.

[5]宿荣荣,徐 嘉.甘肃省高校学生人群超重/肥胖不同判定标准的比较研究[J].南京体育学院学报(自然科学版),2013,12(5):152-156.

[6]熊忆菲,李 平.铁辘栌把社区居民超重肥胖与疾病关系调查分析[J].中国社区医师,2006,8(10):97.

[7]Hanley JA,McNeil B J.A method of comparing the are as under receiver operating characteristic curves derived from the same cases[J].Radiology,1983,148(3):839-843.

[8]张建国.ROC曲线分析的基本原理以及在体质与健康促进研究中的应用[J].体育科学,2008,28(6):62-66.

[9]ALL SON DB,FAITH MS,HEOM.Meta analysis of the effect of exduding early deaths on the estimated relationship between Body mass index and mortality[J].ObesRes,1999,7(7):342-354.

[10]HANK-KHAN RIWSE RA,FLEG JL.The effect of gender on the relationship between body fat distribution and lung function JC lin Epidemiol[J].ObesRes,2001,54(4):399-406.

[11]于长春,曾邵成,金鑫玲,等,Logistic回归与ROC曲线在儿童巨细胞病毒性肺炎临床筛查中的应用[J].解放军医药杂志,2013,25(8):97-100.

[12]徐继承,李 磊,刘桂红.等.人工神经网络建立食管癌发病预测模型的比较研究[J].现代预防医学,2011,38(17):3408-3410.

[13]朱文斌,陈涵强,周进福,等.SPSS中的ROC分析用于CH筛查方法的评价[J].现代预防医学,2008,35(6):3077-3018.

猜你喜欢
甘肃省高校学生人群
致敬甘肃省腹腔镜开展30年
甘肃省机械工程学会
甘肃省发布第1号总林长令
高校学生党支部建设及作用发挥探索
糖尿病早预防、早控制
甘肃省天水市泰安县桥南初级中学
高校学生意外伤害事件应对与处理
我走进人群
财富焦虑人群
小议高校学生违纪处分制度