中国临床实践指南制订的进展研究
——基于2010~2020年文献的系统评价

2022-03-01 09:52张蓉靳英辉黄桥任相颖阎思宇王永博张军
中国循证心血管医学杂志 2022年11期
关键词:方法学指南证据

张蓉,靳英辉,黄桥,任相颖,阎思宇,王永博,张军

20世纪80年代以来,全球范围内逐渐开始了制订临床实践指南(CPG)的热潮,临床实践指南(以下简称“指南”)旨在以具有权威性和实践意义的临床意见指导医疗实践[1,2]。指南已成为临床工作中不可或缺的重要组成部分,是改善临床决策及患者结局的重要工具。1990年美国医学研究所(IOM)首次提出了CPG的定义:针对特定的临床情况,系统制订出帮助临床医生和患者做出恰当处理的指导性意见[3]。随着循证医学的发展及其对指南的影响,2011年,IOM在其出版的著作《Clinical practice Guideline We Can Trust》中对CPG的定义进行了更新:CPG是针对患者的特定临床问题,基于系统评价形成的证据,并对各种备选干预方式进行全面的利弊平衡分析后提出的最优指导意见[4]。目前普遍认为指南即循证指南,是基于严格评价的证据,同时考虑患者的意愿和偏好以及资源消耗等各方面要素,通过规范科学的方法制订指南,是当前指南发展的趋势,也是各类国际组织指南的主流。

近年来指南制订在我国广受关注,所发表的数量增长迅速,自2010年以来,中国国内数据库(如中国期刊全文数据库和万方数据库)共收录了上千部针对各个领域多种疾病的指南。这些指南中对于疾病诊治的推荐意见是各级医院临床医师诊治患者的重要依据。以往研究显示国内指南制订过程的严谨性和规范性仍有待改善,符合方法学质量要求和报告学规范的比例相对较低[5-16]。这些被评价的指南大多针对某类疾病专业领域,除了研究者[16]在2012年发布的1993~2010年的指南评价外,此后未见有对国内指南的发展进行追踪报道的研究。为了解近年临床实践指南在国内的发展现状及趋势,我们系统检索及分类总结了2010~2020年国内自主制订并发布的指南,以期为国内指南制订者及使用者提供参考。

1 资料与方法

1.1 纳入指南的获取途径

1.1.1 检索策略由2名研究者系统检索中国期刊全文数据库(CNKI)和万方数据库(WanFang Database),以“指南”、“实践指南”、“临床指南”、“临床实践指南”为题名检索词,检索时限为2010年1月1日~2020年12月31日。

1.1.2 纳入及排除标准纳入标准:国内公开发表的、可获取全文的中文版原创临床实践指南(以下简称指南)。排除标准:解读类、汇编、改编版指南;国外指南的翻译版本;信息省略的非完整性指南,如仅包含简介、目录、摘要、推荐意见的简要版本。

1.2 资料提取本研究组成员根据指南的一般特征结合指南质量评价工具AGREE-Ⅱ的内容进行充分讨论提取本研究关注的条目,形成资料提取表。一般特征信息包括:名称、发表期刊、发表时间、同一版本发表次数、再版或更新情况、制订单位及其分类、主题及用户分类、疾病分类、页数、参考文献数量、针对的目标人群。其中,指南的制订单位结果提取包括:国家卫生健康委员会(前国家卫生部和计划生育委员会)、学会/协会、机构、个人(工作组或委员会);主题分类结果提取包括:预防、诊断、治疗、预防与治疗、诊断与治疗、护理、康复、技术操作、卫生政策、传染病防控;纳入的指南涉及的疾病分类参考国际疾病分类(ICD-11)。方法学质量信息包括:多学科合作制订指南、行充分的文献检索、对纳入文献进行质量评价、推荐意见基于系统评价、有明确的证据及推荐强度分级标准、形成推荐意见时考虑了相关因素(可行性、经济性、安全性、公平性及患者意愿等)、明确描述了推荐意见、标注了证据等级、标注了推荐意见强度、报道了利益冲突的调查结果。由两名评价者分别对纳入的每部指南进行信息提取。使用Kappa值评估两名评价者之间的一致性,Kappa>0.75表明评定者间一致性好。若存在条目一致性不满足,则由第三位评价者检查更新评估结果。

1.3 统计分析将纳入的指南根据年份进行总结和分层,以频率和百分比进行描述,使用“色阶图”和折线图反映近11年国内制订并发布的指南的质量趋势,调整图像基本色调以便于为读者提供直观的参考。使用Microsoft Excel软件录入和整理数据,运用R语言” trend” 包进行Mann Kendall趋势检验(M-K检验)的非参数方法检验指南的方法学质量随时间变化的趋势,P<0.05为差异有统计学意义。

2 结果

2.1 纳入指南的一般特征信息初检共获得相关文献7546部,经逐层筛选去重,符合要求的指南共1127部。具体筛选流程结果见图1。

图1 文献筛选流程

2.1.1 发表数量及类别2010~2020年中国指南发布的数量整体呈上升趋势,近两年指南的发表数量较前增加明显。指南年度发表总数量在2012年最低为32部,至2020年最多为189部,占发表总数量的16.77%(189/1127),图2。

图2 2010~2020年国内指南发表数量及占比

指南发表的数量以诊断与治疗居多,占53.24%(600/1127),其余分别为治疗(24.22%)、诊断(6.12%)、传染病防控(3.55%)、护理(2.57%)、预防与治疗(2.48%)、技术操作(2.22%)、预防(2.04%)、管理与政策(1.95%)、康复(1.60%);按指南所涉及的领域分类,西医类960部、中医类118部和中西医结合类49部,分别占85.18%(960/1127)、10.47%(118/1127)和4.35%(49/1127);按其所涉及的用户分类,仅7部明确提出为患者使用,其余均为医护人员参考使用;按WHO分类原则,标准指南1104部,快速指南13部(静脉麻醉、困难气道处理、术中脑功能监测、急性冠脉综合征急诊诊疗、新型冠状病毒肺炎诊疗等),暂行指南有10部(多重耐药菌医院感染预防与控制、急性呼吸窘迫综合征患者机械通气、SARS-CoV-2流行期间癌症患者治疗选择等)。

2.1.2 发表次数及期刊分布同一版本指南被重复发表的次数有1~20次不等,其中,发表1、2次居多,分别占发表总数的79.15%(892/1127)、11.98%(135/1127)。被发表了20次在不同的杂志上的指南名是《慢性乙型肝炎防治指南(2010年版)》。指南所发表的期刊(含电子版)多达377本,发表指南最多的前六位杂志是《中华全科医师杂志》、《中华神经科杂志》、《中国中医药现代远程教育》、《中华医学杂志》、《中华风湿病学杂志》和《中华妇产科杂志》。

2.1.3 制订单位和疾病覆盖范围指南大部分由学会/协会制订72.58%(818/1127),51部(4.53%)由国家卫健委单独或联合制订,173部(15.35%)由个人(包括工作组或委员会)制订,其他指南由不同的机构、慈善或公益组织等制订或联合制订。在不同的学科中,指南的制订所覆盖的疾病种类从高到低依次为肿瘤(11.00%)、循环系统疾病(10.56%)、肌肉骨骼系统和结缔组织疾病(7.45%)、某些传染病和寄生虫病(7.36%)、消化系统疾病(7.28%)、内分泌及营养和代谢疾病(6.92%)、呼吸系统疾病(6.92%)。

2.1.4 目标人群指南的目标人群有38部(2.42%,3.37%)为孕产妇,201部(17.83%)针对儿童及以下年龄(≤12岁)患者。

2.1.5 指南的更新本研究中,共有127部(11.27%)指南被更新,这些更新了的指南分1~4版不等,更新了1版的有95部(8.43%),更新了2版的有21部(1.86%),更新了3~4版的有11部(0.98%);指南所更新的间隔年限为1~10年,8.25%(93/1127)的指南2~4年更新一次。

2.2 纳入指南的方法学质量信息针对指南的方法学质量信息,采用色阶图展示在近11年期间满足方法学评价各条目要求的数量变化(图3)。指南中推荐意见基于系统评价和明确描述了推荐意见的比例较高,形成推荐意见时考虑了可行性、经济性及公平性等因素的比例最低。

图3 2010~2020年指南的方法学质量相关内容结果

2.2.1 多学科合作117部(10.38%)指南在制订过程中成立了多学科的工作组(组中至少包括一名方法学专家如系统评价专家,流行病学家,统计人员等)。指南满足这一评价条目的数量在近11年期间变化不明显,其质量未呈现出明显提升的趋势(P>0.05)。

2.2.2 证据的检索与评价所纳入的指南中有138部(12.24%)进行了充分的文献检索(至少检索4个中英文数据库),有110部(9.76%)对纳入的文献进行了质量评价。指南满足这两项评价条目的数量在近些年逐渐增多,其质量呈明显提升的趋势(P<0.05)。1127部指南中,参考文献数量在100条以上的137部,占发表总数量的12.16%(137/1127)。参考文献数量最多的指南是《中国脑性瘫痪康复指南(2015)》,为960条,该指南被分为十一个部分发表在《中国康复医学杂志》中(包括概述、评估与干预、康复治疗、护理与管理)。

2.2.3 系统评价支持形成推荐意见2010~2020年,基于系统评价支持的指南有374部,占发表总数量的33.19%(374/1127),尽管基于系统评价支持的推荐意见的指南不足二分之一,但指南满足这一评价条目的数量随着时间的推移逐渐增多,其质量呈明显提升的趋势(P<0.01)。

2.2.4 证据等级、推荐强度分级和推荐意见的形成指南所使用的证据/推荐意见的分级标准、证据等级及呈现形式不统一,分级标准多达27种,表达形式多种多样,包括字母、数字、语言描述及其相互组合,这些标准常来自于北美、欧洲学会/协会所发布,在文内明确指出所使用的分级标准名的指南有285部,占其发表总数量的25.29%(285/1127),其中有115部(10.20%)指南使用的是GRADE证据质量分级和推荐强度系统(表1)。部分证据质量及分级系统未标注来源或参考文献,我们归纳为自定义的标准名,使用这类分级标准的指南占总发表数量的10.29%(116/1127)。

表1 2010~2020年指南使用的证据质量与推荐强度分级标准

纳入本研究的指南中,明确描述了推荐意见的指南有387部(34.34%),其推荐意见在形成过程中考虑了可行性、经济性、安全性、公平性及患者意愿等因素的指南仅55部,占其发表数量的4.88%(55/1127),指南满足这一评价条目的数量在近些年虽然不多,但其质量仍呈现出明显改善的趋势(P<0.01)。

明确描述推荐意见的指南中,有330部(29.28%)标注了证据等级,349部(30.97%)标注了推荐强度,300部(26.62%)同时标注了证据等级和推荐强度。指南满足这些评价条目的数量在近些年逐渐增多,其质量呈现出提升的趋势(P<0.05),尤其是对推荐强度进行标注的指南趋势更加明显(P<0.01)。

2.2.5 基金资助和利益冲突指南项目组的所有成员在参加指南会议之前要求填写利益声明表。2010~2020年所发布的指南报告了在制订过程中得到基金或项目资助的比例为22.89%(258/1127),其中3.37%(38/1127)的指南受国家自然科学基金(包含面上项目、青年项目)资助,3.19%(36/1127)的指南受国家科技部科技支撑计划项目资助,6.12%(69/1127)的指南受国家中医药管理局资助。

共有260部指南(23.07%)对制订者的利益冲突进行了调查与报道,满足这一评价条目的数量近年来明显增多,这一方法学质量随着时间的推移呈明显改善的趋势(P<0.01)。

在指南的基金支持中,有13部明确描述接受了企业支持,但其中仅5部声明这些企业不参与或影响指南学术内容(证据评估、共识过程)。

3 讨论

本研究以大量的描述性数据对国内发表的近11年指南进行了一般特征和重要方法学信息的分析。结果表明,近年来我国自主制订发布的指南数量增多的同时,其方法学质量也随着时间提升,仅多学科合作制订指南这一项未能改善,虽然统计学没有意义,但从年度数据来讲,仍有稳步提升的趋势。

目前指南的制订存在以下几个问题:用户为患者的指南极少;指南所针对的目标人群不够明确;仅1/10的指南制订过程中成立了多学科工作组;不到1/5的指南制订进行了充分的文献检索并进行质量评价;仅约1/3的指南进行了证据质量和推荐强度分级;推荐意见的形成较少考虑患者的价值观和偏好;利益冲突的管理未能充分受到重视;未能及时更新指南仍占多数。指南的质量主要体现在制订的科学性、规范性和透明性方面[17]。作为最高级别的证据,系统评价是支持推荐意见的最佳证据,但当前具有系统评价支持的指南比例不高。在进行指南制订时对于证据的系统检索与评价仍是指南制订者未来需要加强的重点。另外IOM在指南的6条基本原则也特别强调了当新的重要证据出现时,需重新审查指南并适当修改推荐意见[4]。指南制订机构应该有计划地对指南进行定期监测和及时更新,以确保并提高指南推荐意见的时效性和质量[18,19],然而本研究发现得到及时更新的指南仅占极少数。指南的制订是一个多学科专家共同参与和决策的过程,指南方法学家在其中发挥着关键作用,特别是在系统应用证据和规避利益冲突方面[20-22]。近期一项针对指南制订人员及工作组的研究表明,在2019年期刊公开发表的中国指南中参与制订的人员无论在数量上还是在职责与组别上均存在明显的差异性、不规范性及报告的不充分性[23]。利益冲突的存在是指南制订过程中重要的潜在偏倚来源[24],为保证指南的客观性、科学性和透明性,指南制订组中的相关成员均应进行利益冲突的调查与管理。本研究显示国内指南制订过程中利益冲突的管理仍是薄弱环节,与近几年国内学者研究报道结果一致[25,26]。

目前,我国尚无国家层面发布的临床实践指南制订与修订指导原则[27]。国内指南的制订大多依托于学会/协会(如中华医学会),指南是其杂志社重要的发表类型之一,并于2016年专门刊发了制订和修订指南的基本方法及程序[28,29],然而其他学会/协会或机构制订指南所依据的标准可能未必统一。可能是国内制订并发布的指南质量良莠不齐的原因之一,且指南在某些方法学特征及要求上仍存在一些争议和误解,如国际指南是否适合本土使用?患者应如何参与在指南的制订过程中?一部指南应该解决多少个临床问题?证据质量低时是制订指南还是专家共识?其中国际指南是否适合在本土使用已被诸多学者争议多年[30],这些问题需在未来指南的制订和研究中进一步探讨。我们认为,即使目前部分国内研究质量仍有一定缺陷,但就方法学而言,仍可以制订出好的指南,且非常有必要制定本土指南。低质量证据不代表低质量指南。

综上,本研究提出以下提高指南质量的建议:①重视尤其是循证方法学家在制订指南中的作用,合理安排多学科工作组中来自不同专业背景的人员配比;②未来制订/修订指南时,需加强对利益冲突的声明;③制订者应对已发表的指南定期监测和及时、有效地更新;④建立指南制订的标准及评价体系,将更为广泛地邀请国内的方法学家和指南使用者参与到指南评价的工作中,帮助其使用者选择高质量的指南,用以指导临床决策;⑤指南制订机构应该严格按照循证指南的制订要求,规范指南的制订,相关杂志出版社在指南发布之前严把指南质量关;⑥在条件允许的情况下,建议将指南方法学融入医学教育和培训,特别是要加强对基层医疗机构、基层医务人员、全科医生的指南知晓度和应用操作培训。

本研究的局限性在于:一方面2010~2020年的指南数量庞大,考虑到工作量及其时效性,资料提取的内容未能按照指南研究与评价工具AGREE-Ⅱ的6个领域23个条目逐一提取,仅提取了方法学质量的相关核心条目。另一方面,因指南方法学质量和报告质量具有很高相关性[31],对于方法学的评价很大程度上基于指南的报告,对没有充分报告的信息,未联系其制订者进一步获取与分析,故本研究的结果可能存在一定的信息偏倚。

4 小结

总体而言,指南的方法学质量逐年提升。基于严格评价的证据,考虑患者的意愿和偏好及资源消耗等各方面要素,以规范科学的方法制订指南,是当前指南发展的趋势;帮助指导医疗实践,促进患者健康,是指南存在的现实意义。虽然国内指南与国际指南相比还有一定的差距,但未来经过中国的卫生政策制订者、管理者、临床医务人员和循证医学方法学家的共同努力,切实指导中国临床实践的高质量指南一定会越来越多。

猜你喜欢
方法学指南证据
大型学术著作《药理研究方法学》出版发行
药品微生物限度检查方法学验证的研究进展
指南数读
对于家庭暴力应当如何搜集证据
手上的证据
追踪方法学在院前急救护理安全管理中的应用
论碰撞的混搭指南
手上的证据
“证据”:就在深深的水底下——《今生今世的证据》“读不懂”反思
人降钙素原定量检测方法学评价