职业病防治绩效影响因素分析

2016-06-24 02:48乐曹爽李士雪徐凌忠李群伟
中国卫生统计 2016年2期
关键词:共线性

张 乐曹 爽李士雪徐凌忠李群伟



职业病防治绩效影响因素分析

张 乐1曹 爽2李士雪3徐凌忠3李群伟1

【提 要】 目的 确定影响职业病防治绩效的影响因素。方法 采用偏最小二乘回归法建立绩效指数及其影响因素的回归模型。结果 人均GDP、规模以上工业万元增加值能耗、财政赤字率、第二产业比重、城镇登记失业率和职业病危害因素接触率与绩效指数呈负相关,R&D投入占GDP的比例、规模以上工业产值中高新技术产业比重、卫生技术人员千人拥有量、大专以上文凭所占比重与绩效指数呈正相关。结论 优化产业结构,加速粗放型经济向集约型经济的转化是改善职业病防治绩效的关键。

【关键词】职业病防治绩效 偏最小二乘回归 共线性 主成分

1.泰山医学院公共卫生学院(271016)

2.济南市儿童医院

3.山东大学公共卫生学院

职业病防治工作是一项极其复杂的系统工程,其绩效的优劣并不单纯取决于政府相关部门及用人单位努力程度,而是受到政治、经济、文化、社会、科技以及自然等环境因素的影响。本研究在筛选出这些有代表性影响因素的基础上,进一步确定这些因素与职业病防治绩效的定量关系,从而为职业病防治绩效的改善提供依据。

对象与方法

1.研究对象

采用分层随机抽样的方式,按照工业化水平的高低,将山东省地市级行政区域划分为工业化高、中和低三类,分别从工业化水平高的地区选择烟台市、威海市和莱芜市,从工业化水平中等的地区选择枣庄市、济南市和潍坊市,从工业化水平低的地区选择济宁市、聊城市和菏泽市,共选择九个地级市为样本。

2.研究方法

采用文献复习与归纳的方法,选择可能与职业病防治绩效相关的因素,建立指标库,从《山东省统计年鉴》中获取2013年样本地区各关键指标的资料,然后利用专家咨询法对其进一步筛选,并建立其与职业病防治绩效指数的回归模型。10个指标分别为:人均GDP(X1)、规模以上工业万元增加值能耗(X2)、财政赤字率(X3)、第二产业比重(X4)、城镇登记失业率(X5)、R&D投入占GDP的比例(X6)、规模以上工业产值中高新技术产业比重(X7)、卫生技术人员千人拥有量(X8)、大专以上文凭所占比重(X9)和职业病危害因素接触率(X10)。

3.统计分析

本研究主要采用偏最小二乘回归法建立其与绩效指数的模型,用excel 2003建立数据库,使用统计软件SAS9.1进行分析,建模方法如下:

设有q个因变量和p个自变量。为了研究因变量与自变量的统计关系,观测了n个样本点,由此构成了自变量与因变量的数据表x和y。偏最小二乘回归分别在x与y中提取出t和u,要求:①t和u应尽可能大地携带它们各自数据表中的变异信息;②t和u的相关程度能够达到最大。在第一个成分被提取后,偏最小二乘回归分别实施x对t的回归以及y对t的回归。如果回归方程已经达到满意的精度,则算法终止;否则,将利用x被t解释后的残余信息以及y被t解释后的残余信息进行第二轮的成分提取。如此往复,直到能达到一个较满意的精度为止。

结果与分析

参考数据散点图,本研究给出以下数学模型:

1.数据的标准化处理

2.主成分提取个数的选择

采用去一交叉验证法提取成分,共提取两个主成分,所提取的两个主成分对自变量X的解释能力为72.51%,对因变量Y的解释能力为96.83%,包含极多的信息,详见表2。

3.偏最小二乘回归模型的确定

在提取两个主成分时,可以计算出基于偏最小二乘的回归方程,详见表3。显然X1、X2、X3、X4、X5和X10与Y呈负相关,其他自变量与Y呈正相关。

4.回归模型精度检验

回归模型构建完毕后,尚需对其预测的精度进行检验,检验结果显示,回归模型对样本地区职业病防治绩效指数预测的误差最高为4.112%,均不高于5%,说明回归模型的精度较好。

表1 因变量与自变量的标准化值

表2 主成分个数选择及解释能力

表3 偏最小二乘回归分析结果

讨 论

偏最小二乘回归法[2]是由S.Wold和C.Albano等人所创立,最早应用于化学领域,目前已被广泛应用于包括医学在内的众多领域[3-5]。它能够解决自变量之间的多重共线现象,而且能够将所有的解释变量均纳入到回归方程中。而本研究10个自变量之间存在严重的共线性,因此,本研究选择偏最小二乘回归法建立回归模型。

本研究在筛选出这些有代表性的影响因素的基础上,通过建立绩效指数与其影响因素的回归方程,进一步确定这些因素与职业病防治绩效的定量关系,从标准化系数的大小来看,对职业病防治绩效影响最大的是职业病危害因素接触率,其次是第二产业比重,第三是规模以上工业产值中高新技术产业比重,第四是规模以上工业万元增加值能耗,而对职业病防治绩效影响最小的是财政赤字率,其次为城镇登记失业率。

职业病危害因素接触率衡量既有职业病危害程度,第二产业比重衡量一个区域的产业结构,规模以上工业产值中高新技术产业比重和规模以上工业万元增加值能耗两个指标衡量一个区域的科技发展水平和产业的集约化程度。因此,我们的当务之急是优化产业结构,提高第三产业的比重,并加速从粗放型经济向集约型经济的转化,提高高科技成分在产业中所占的比例。

参考文献

[1]张乐.职业病防治绩效评价与分析研究.山东大学,2014.

[2]王惠文.偏最小二乘回归方法及其应用.北京:国防工业出版社,1999.

[3]肖琳,何大卫.PLS回归分析法及其医学应用.中国卫生统计,2002,19(2):76-79.

[4]王园园,陈景武.偏最小二乘回归分析在医学中的正确应用.中国卫生统计,2010,27(2):208-209.

[5]张胜林.健康行为改变理论统计模型研究-结构方程模型的应用.华中科技大学,2009.

(责任编辑:郭海强)

猜你喜欢
共线性
勘误说明
南瓜SWEET蛋白家族的全基因组鉴定与进化分析
银行不良贷款额影响因素分析
银行不良贷款额影响因素分析
关于多重共线性的三个知识点的准确表述
发育生物学奠基人:刘易斯
不完全多重共线性定义存在的问题及其修正建议
我国寿险需求影响因素的岭回归分析
岭回归分析在解决经济数据共线性问题中的应用
杨树和柳树基因组共线性的可视化分析