基于决策树模型食管癌病例组合研究*

2016-10-26 05:21许琼琼仲亚琴强福林吴徐明袁丽萍高月霞
中国卫生统计 2016年4期
关键词:决策树住院费用食管癌

许琼琼 肖 静 沈 康 仲亚琴 强福林 吴徐明 袁丽萍 高月霞△



基于决策树模型食管癌病例组合研究*

许琼琼1肖静1沈康2仲亚琴1强福林2吴徐明2袁丽萍2高月霞1△

【提要】目的探索南通市食管癌病例的DRGs分组方案及费用标准,为相关部门决策提供依据。方法对2006-2013年南通市肿瘤医院以食管癌为主要诊断的11784例病案数据进行多重线性回归分析,筛选分类节点变量,运用决策树模型进行病例分组,采用绝对值法和相对权重法对住院费用的标准进行测算。结果治疗方法、首次入院、年龄、性别、伴随疾病、并发症、转归等作为食管癌病例分类节点的关键变量,建立了21个DRGs组及住院费用标准。结论病例分组结果合理,住院费用标准和病种权重可以作为相关部门参考。

食管癌住院费用疾病诊断相关组决策树

食管癌是中国常见的恶性肿瘤之一,严重威胁着居民健康。据报道,2010年江苏省食管癌的发病率为41.93/10万,死亡率31.15/10万,肿瘤发病率和死亡率均排名第3[1]。食管癌患者的疾病负担较重,住院费用比较高,变异比较大,最小值在1万元,最大值近30万,平均4.7万元[2-3]。这主要与国内现行的医保付费方式有关,按服务项目的后付制支付方式,导致过度医疗和医疗费用快速增长。按病种支付等预付制,被认为是有效控制医疗费用增长的支付方式之一。早在1983年美国引进基于DRGs分组的预付费机制[4],有效地控制了医疗费用的增加。欧洲很多国家相继引进基于DRGs的支付机制[5]。2012年中国政府在北京的6家医院进行DRGs付费制度试点改革,改革后患者的住院总费用降低了6.2%,个人自付费用降低了10.5%[6]。DRGs分组是基于疾病自身特点、治疗手段、有无并发症或合并症等情况,根据资源消耗的程度制定付费疾病分组标准。国内学者从20世纪80年代开始,研究探讨建立适合我国国情的疾病诊断相关分组及费用标准制定和成本核算,如陈龙[7]等对高血压患者进行了DRGs病例组合的费用测算,杨晓蓉[8]对循环系统的病例组合方案进行制定和评价。国内还没有食管癌患者的病例组合研究报道,本研究对南通市某肿瘤专科医院11 784例食管癌患者进行住院费用分析,基于数据挖掘的决策树模型进行DRGs分组及费用测算评价,为医保预付费制度实施提供依据。

资料与方法

1.数据来源

数据来源于南通市肿瘤医院2006年1月至2013年12月诊断为食管恶性肿瘤的住院病人病案首页数据库,将出院主诊断不是食管癌的病案剔除。为了减少离群值对研究结果的影响,数据预处理的排除标准如下:(1)将住院天数小于1或大于100天的病案剔除;(2)将住院费用小于1%或大于99%的病案剔除。经过筛选纳入的有效数据为11784例,年龄最小22岁,最大99岁,平均年龄(63.82±8.30)岁,中位年龄64岁。

2.研究变量及赋值

本研究以住院费用作为因变量,所有住院费用用当年的居民消费价格指数(CPI)调整,住院费用最小值为1855元,最大值70969元,平均(22065±14667)元。以年龄、性别、首次入院、伴随疾病等作为自变量,进行多重线性回归,用方差膨胀因子(VIF)进行共线性诊断,筛选分类节点变量。变量分布及赋值见表1,样本中有63.4%的病人医疗保险状况为自费,该样本主要是异地就医的病人。

表1 11784例食管癌患者基本特征及赋值

3.病例组合方法

采用SPSS20.0软件进行数据统计分析和决策树模型(decision tree)构建与修剪[9],卡方自动交互检测(CHAID)算法构建决策树,交叉验证方法(cross validation)对树模型自动修剪,样本群数为10。住院天数为影响食管癌住院费用的重要变量[10,14],本研究将住院天数作为影响变量纳入决策树模型。以住院费用为因变量,以住院天数为影响变量,以性别、年龄、伴随疾病、并发症、治疗方法等作为分类节点。本研究参数设置使用:决策树最大深度为3,父节点的最小样本数为100,子节点的最小样本数为50,拆分节点的检验水准α=0.05。分组效果评价:组间的差异用非参数Kruskal-Wallis检验,组内变异用变异系数(CV)来检验分组的合理性。

结  果

1.分类节点变量筛选

住院费用多重线性回归结果见表2,从标准偏回归系数可知,手术、放疗及化疗对住院费用的影响最大,其次是首次入院和医保方式对住院费用的影响较大,疾病转归、年龄、性别、有无伴随疾病及有无并发症也是住院费用的影响因素。模型的共线性诊断表明,所有VIF<5,可以认为不存在共线性问题。以治疗方式、首次入院、疾病转归、有无并发症、有无伴随病、年龄和性别作为分类节点变量。

表2 食管癌住院费用多重线性回归分析

2.分类结果

本研究11 784例食管癌病例共形成21个DRGs组合,各分组的均数、中位数、标准差及变异系数见表3。为确定分组的合理性,我们对各病例组合进行非参数Kruskal-Wallis检验,结果均是P<0.001,说明住院费用组间异质性较好。各病例组合变异系数CV值见表3,中位数与均数比较接近,说明组内差异较小,分组较为合理。

表3 食管癌DRGs分组结果(住院费用,元)

3.病例组合住院费用的相关标准制定

基于以上方法病例分组后,可以用住院费用中位数制定费用参考值的标准[11],计算住院费用上限时,采用各组合住院预测费用的75%加1.5倍四分位间距[12]。本研究中,食管癌患者住院费用超过费用上限定义为超标费用,超标总例数为978,占本次研究总例数的8.3%。计算各DRG组的病种权重[13],是指该种DRG组合的例均住院费用与所有病例平均费用的比值,权重越高,说明病人消耗的资源越多,具体见表4。

表4 食管癌DRGs分组的住院费用标准及病种权重

讨  论

本研究中基于决策树中的回归树模型,将11784例食管癌病例根据不同的治疗方案分成21个组,组间异质性较大,组内异质性较小,分组合理。分组变量没有选择住院天数,主要是考虑到国内还没有实施规范化的临床路径管理,住院天数的变异较大,这与国内现有的研究一致[7-8,12]。住院天数作为影响住院费用的重要变量[10,14],不能作为分组变量,可以作为影响变量,纳入到决策树模型。与现有的研究相比,这是本研究在模型设定方面的重要改进。与传统的多重线性回归相比,决策树模型不要求变量具有特定的分布,对存在离群值和有偏分布的数据不太敏感,通过交叉验证等方法对模型进行合理剪枝,可达到稳定可重复的效果[14]。缺失值的处理也是决策树模型一大优势,本研究将缺失值作为单独一类,独立分组效果较好,符合临床实践中实际住院费用的分布。

分类节点变量选择合理,分组效果较好。首次入院是影响肿瘤住院费用的重要变量,本研究发现在化疗治疗病例组合中,首次入院组住院费用的中位数较高,这在医疗保险相关部门决策中参考价值较大。治疗效果、年龄、并发症和伴随疾病是影响各组的主要变量,手术组病例组合中,有并发症组的费用高于没有并发症;放疗病例组合中,59岁以上治愈组费用最高。另外,没有将医保方式纳入到决策树模型,主要是由于分组决定因素是疾病的社会学特征与疾病特征。在医保部门实际运用过程中,可以根据各地医保筹资情况,在住院费用标准基础上适当地增加权重。另外,疾病严重程度未能纳入回归树模型中[15],主要与病案质量有关,在以后的研究中应进一步完善。

本研究从2006年到2013年时间跨度比较长,研究样本量大,通过交叉验证剪枝,病例组合分组可重复性强,病例组合费用具有很强的参考价值。在医保部门实际应用中,主要有住院费用绝对值法和病种相对权重系数法[13]。相对权重系数法是指先根据一定的原则确定一个基准组合,用各组合的平均费用与基准组合平均费用的比值表示相关权重系数。通过计算各病种相对权重系数,可以连接所有的病种,进行按病种分值结算,体现医保支付的科学性。因此,医保部门在实际运用过程中,可以根据这些分组费用之间的比例关系,医保基金的实际支付能力,确定一个合适的参考值。病例组合医疗费用的参考价值在于分类标准的确定,而不是具体的费用绝对值的大小。

[1]韩仁强,武鸣,俞浩,等.2010年江苏省肿瘤登记地区恶性肿瘤发病与死亡.江苏预防医学,2015,1:5-10.

[2]叶斌.食管癌手术患者住院费用及影响因素研究.浙江大学,2015.

[3]胡志平,冯向先,潘雄飞.食管癌患者住院费用影响因素分析.中国公共卫生,2013,3:315-317.

[4]Hsiao WC,Sapolsky HM,Dunn DL,et.al.Lessons of the New Jersey DRG payment system.Health Affair,1986,5(2):32-45.

[5]Busse R,Geissler A,Aaviksoo A,et al.Diagnosis-related groups in Europe:moving towards transparency,efficiency and quality in hospitals.Open University Press,Maidenhead,93-114.

[6]Jian W,Lu M,Chan KY,et al.Payment reform pilot in Beijing hospitals reduced expenditures and out-of-pocket payments per admission.Health Affair,2015,34(10):1745-52.

[7]陈龙,马利,何文英,等.高血压住院患者DRGs分组方法研究.中国卫生统计,2015,32(1):110-111.

[8]杨晓蓉,吴明.循环系统病例DRGs组合研究.中国卫生统计,2010,27(2):163-165.

[9]Fetter RB,Mills RE,Riedel DC,et al.The application of diagnostic specific cost profiles to cost and reimbursement control in hospitals.Journal of Medical Systems,1977,1:137-49.

[10]杨梅,肖静,陈德喜,等.8288例食管癌患者住院费用影响因素的通径分析.现代预防医学,2013,5:801-803.

[11]董军,胡德奎,陈剑伟,等.病种费用控制标准实验研究.中华医院管理杂志,2001,9:529-531.

[12]高建民,郑古峥玥,詹梅,等.基于疾病诊断相关组合的住院费用标准合理化探讨.中国卫生经济,2013,3(1):22-24.

[13]赵一鸣.对回归树的建模与应用一文的几点补充.中华预防医学杂志,2003,27(3):141-145.

[14]高建民,郑古峥玥,詹梅,等.疾病诊断相关分组分类节点变量的选择及其分组结果的合理性评价.中国卫生经济,2013,3(1):16-19.

(责任编辑:刘壮)

Case-Mix Study of Patients with Esophageal Cancer Based on Decision Tree

Xu Qiongqiong,Xiao Jing,Shen Kang,et al

(Department of Health Statistics,School of Public Health,Nantong University(226004),Nantong)

ObjectiveThe study explored the case-mix diagnosis-related-groups of patients with esophageal cancer in Nantong and developed related health expense standards,so as to provide evidence for related departments′ decisions.MethodsAccording to 11 784 inpatients with the principal diagnosis as esophageal cancer from 2006 to 2013 in Nantong tumor hospital,multiple regression model was employed to screening the classification node variables,and the decision tree model was applied to set up the case-mix diagnosis-related-groups.The absolute value method and relative weights were used to calculate the standard.ResultsThe main classification node variables were therapies,first hospitalization,age,gender,concomitant diseases,complication,and prognosis.21 diagnosis-related-groups and related health expense standards were established.ConclusionCase-mix diagnosis-related-groups are reasonable,and the health expense standards and related case weight could make

for related departments.

Esophageal cancer;Hospitalization expense;Diagnosis-related-groups;Decision tree

南通市科技局社会发展项目资助(HS2013004);南通大学博士科研启动基金(14B16)

高月霞,E-mail:gaoyuexia1103@163.com

1.南通大学公共卫生学院流行病卫生统计系(226004)

2.南通市肿瘤医院科教科

猜你喜欢
决策树住院费用食管癌
新生儿肺炎患者(日龄<1 天)住院费用及影响因素
我国脑卒中患者住院费用及影响因素研究
肠内营养支持在放化疗食管癌患者中的应用
决策树和随机森林方法在管理决策中的应用
桑植 卫生院住院费用全报销
基于决策树的出租车乘客出行目的识别
国家卫计委:2017年实现住院费用异地结算
胸腹腔镜联合食管癌手术的配合
MCM7和P53在食管癌组织中的表达及临床意义
基于模糊关联规则和决策树的图像自动标注