退行性腰椎管狭窄症相关指南的质量评价和推荐意见比较研究

2023-02-23 07:08安易陈红周彦吉刘鲁平陈千吉雷园孙艳艳王锡友刘长信张洋于长禾
中国全科医学 2023年11期
关键词:共识循证指南

安易,陈红,周彦吉,刘鲁平,陈千吉,雷园,孙艳艳,王锡友,刘长信,张洋,于长禾*

退行性腰椎管狭窄症(degenerative lumbar spinal stenosis,DLSS)是一种退行性疾病,以腿痛、腰痛,伴有神经源性间歇性跛行等症状为主要表现[1]。在美国,现存DLSS患者有20多万人,是导致疼痛和残障的主要原因之一,也是>65岁患者进行脊柱手术的最主要病因[2]。关于退行性腰椎疾病的研究显示,全球每年有1.02亿人(1.4%)被诊断为椎管狭窄[3]。Framingham研究表明,有19%~47%的60岁以上美国人有椎管狭窄的影像学证据[1,4-5],DLSS的患病率将随着老龄化的加剧和医学检验技术的进步而进一步升高。

指南在医疗诊治过程中发挥着积极而不可或缺的作用[6-7],然而,只有方法学设计和报告规范符合要求的指南才能为医疗工作提供更符合医患双方利益的决策依据[8],才可有效指导和规范医生的诊疗行为,提高患者就诊体验,降低国家的医疗负担[9],才能凸显指南评价的意义。目前使用率和认可度最高的指南方法学质量评价工具为AGREEⅡ(appraisal of guidelines research and evaluation Ⅱ),最通用的报告标准为RIGHT(reporting items for practice guidelines in healthcare)。AGREE 自2003年首次发布后即广泛用于指南方法学质量评价中,并于2008年更新为AGREEⅡ[10]。我国发布的指南报告质量还不尽如人意[11],指南制订者对报告规范关注度也不够。2016年RIGHT标准发布并得以应用后[12],在提升了指南质量的前提下还提高了指南在适用人群中的应用度和传播速度[7]。一部好的指南不仅要在制订过程中严格遵守方法学标准[13],还应该在报告时尽量以透明公开的方式保证指南的透明度和完整性[7,14]。本研究采用AGREEⅡ和RIGHT工具评价DLSS相关指南的方法学质量和报告质量,以期在提高指南质量、规范报告标准方面为指南制订人员提供参考。

1 资料与方法

1.1 检索策略 计算机检索中国生物医学文献数据库(CBM)、中国知网(CNKI)、万方数据知识服务平 台(Wanfang Data)、 维 普 网(VIP)、PubMed,补充检索医脉通数据库(Medlive)、世界卫生组织(WHO)、英国国家临床优化研究所(NICE)、国际指南协作网(GIN)、美国国立指南文库(NGC)和苏格兰院际间协作网(SIGN)等指南库,检索时限均为2010-01-01至2022-01-01。中文检索词为腰椎管狭窄、椎管狭窄、脊柱退行性病变、间歇性跛行、神经源性跛行和指南、共识、规范等;英文检索词为lumbar spinal stenosis、spinal stenosis、Spinal Osteophytosis、neurogenic claudication、guideline、consensus、clinical practice guideline等。

1.2 纳入与排除标准 纳入标准:(1)研究类型为临床实践指南、共识或规范;(2)研究对象为DLSS患者;(3)更新或重复发表的文献,仅纳入最新版指南文献。排除标准:(1)指南解读或指南译本;(2)指南制订计划书、草案、试行版、摘要和会议纪要;(3)非中、英文文献;(4)无方法学支撑的文献。

1.3 文献筛选整理 由两位研究者独立完成文献筛选并交叉核对;如遇分歧,则与第三位研究者协商定夺;如遇资料不全或缺失,则尽量与通信作者联系进行补充收集。基于本研究采用的评价工具设计资料提取表,提取内容主要包括:发表(或更新)年份、发表国家、研究对象、指南所用证据质量及推荐等级分级方法、透明度相关问题等。

1.4 质量评估 本研究分别采用AGREEⅡ和RIGHT工具对纳入的文献进行方法学质量评价及报告质量评价。AGREEⅡ包含6个评分领域共23条评分项,每条评分项的最低分为1分,最高分为7分。纳入文献各领域最终得分(标化为百分比)的计算公式如下:各领域得分=(实际分-最低可能得分)/(最高可能得分-最低可能得分)。计算纳入文献的各领域得分总和,计算出实际总得分/总最高可能得分×100%用以比较整篇文献的方法学质量。

RIGHT评价工具包含7个评分领域共22个条目。每个条目以“完全报告(Y)”“部分报告(P)”“未报告(N)”及“不适用(I)”进行定性赋分:“Y”表示该条目所要求信息均在文献中进行表达;“P”表示只有部分所要求的信息得以表述;“N”表示在文献中无法找到相关信息的情况;“I”表示指南不符合某条目评价要求,不能用“Y”“P”或“N”进行定性。此外,在包含多个内容的条目中,未表达出所有要求的信息,便将其评价为“P”。汇总各领域“报告”的频率和百分比,并将“Y”计为2分,“P”计为1分,“N”和“I”计为0分,以实际总得分/总最高可能得分×100%来衡量其总报告率。

1.5 推荐强度分级情况 因目前指南或共识存在推荐强度分级不规范、不统一的情况[15],为使推荐意见之间可以横向比较,由两位研究者分别按照文件中干预类推荐意见的文字描述结合文章所使用的推荐等级标准将推荐等级划分为强推荐、弱推荐、不确定及不推荐4种。对于强推荐及不推荐这类明确意见,根据推荐等级字面表达进行划分;而弱推荐及不确定的等级划分,则需要结合文章中对推荐意见的具体描述。对有证据支持的利大于弊,但又达不到强推荐意见证据充足程度,划分为弱推荐;指南中表示当前证据不足以对某项干预措施进行推荐,或利弊平衡无法确定的推荐意见等级划分为不确定[16]。如过程中出现分歧,交由第三位研究者进行评判。

1.6 质量控制 组内相关系数(interclass correlation coefficient,ICC)是衡量观察者信度和复测信度的指标之一。本研究使用ICC对AGREEⅡ评价结果进行信度检验。RIGHT报告质量评价时,如果两位评价者遇到分歧,交由第三位研究者进行评判。

1.7 统计学方法 采用Excel 2019及SPSS 26.0进行数据统计以及对两名评价者评分结果进行一致性检验;ICC>0.80说明评价者评价结果之间的一致性较好。

2 结果

2.1 文献检索结果 共检索1 402篇文献,经文献管理软件NoteExpress 3.2查重后剩余1 282篇,通过阅读标题和摘要筛选剩余22篇,阅读全文后纳入6篇[17-22]。文献筛选流程见图1。

图1 文献筛选流程图Figure 1 Flowchart of literature screening

2.2 纳入文献的基本特征 纳入的6篇中,4篇为指南[17-20],2 篇为共识[21-22];1 篇为中医指南[17],5篇[18-22]为现代医学指南;纳入的4篇指南中,3篇为循证指南[18-20];在指南的内容上,3篇[17,19-20]内容为诊断与治疗类指南,1篇[18]仅涉及治疗内容;纳入的2篇共识分别为诊断类共识[21]和诊疗类共识[22];6篇文献中,3篇[18-20]使用GRADE作为评价证据等级方法,1篇[22]使用美国预防服务工作组(U.S. Preventive Services Task Force,USPSTF)提供的推荐等级,还有2篇[17,21]未说明使用何种推荐等级。纳入文献的基础信息见表1。

表1 纳入文献的基本信息表Table 1 Basic information sheet for included literature

2.3 纳入文献的质量评价

2.3.1 AGREEⅡ评价结果 经过一致性检验,其结果一致性较高,各领域ICC均>0.92。AGREEⅡ结果显示,纳入文献的方法学质量评价得分偏低。所纳入的6篇文献的实际总得分/实际最高得分的比值从高到低依次为78.2%、53.6%、45.7%、37.7%、28.2% 及 15.0%。 在AGREEⅡ各个领域中,纳入的指南之间差距较大,平均得分中只有范围和目的、表达明晰性两个领域超过了50.0%(52.783%、65.800%),参与人员、制订严谨性、应用性和编辑独立性四个领域平均得分均低于50.0%,其中应用性领域得分平均值最低,仅有31.233%,北美脊柱协会(NASS)指南和加拿大骨关节协会发表的指南中各领域得分均在纳入文献中处于较高,后者最低领域得分也有66.7%。AGREEⅡ各领域平均评分结果见表2。

表2 AGREEⅡ各领域评分结果(%)Table 2 AGREE Ⅱ domain scores for included literature

2.3.2 RIGHT评价结果 因多条RIGHT条目不适用纳入的2篇共识,故在做报告质量评级时仅对4篇指南进行评级。根据RIGHT评价结果,当前关于DLSS的最新指南,整体报告质量并不高。进行RIGHT评价的4篇指南总报告率从高到低依次为72.9%、72.9%、62.9%及34.3%。中医学为基础的指南得分最低。在RIGHT的7个领域中,最符合RIGHT报告规范的是其他方面(可及性、对未来研究的建议和指南的局限性),平均得分为79.125%;在指南证据的报告规范上,虽然纳入的非循证指南[17]得分只有10.0%,但其余3篇指南[18-20]100.0%按照RIGHT的报告规范进行了报道,平均分也有77.5%;在基本信息和背景的报告规范上平均得分均在60.0%以上,分别为73.225%和66.050%;但在评审和质量保证、推荐意见、资金资助与利益声明与管理三个领域,得分最低分别为50.000%,44.650%和28.125%。RIGHT不同领域得分汇总及平均分情况见表3,具体报告结果见表4。

表3 RIGHT各领域得分汇总表(%)Table 3 RIGHT domain scores for included guidelines

表4 RIGHT不同领域报告结果Table 4 Domain-based reporting quality assessment of included guidelines using the RIGHT

2.4 DLSS相关指南临床问题及推荐意见内容分析 纳入的6篇文献中,有5篇[17-20,22]进行了临床问题、推荐意见或共识结果的提出,1篇共识[21]用国际德尔菲法对7个关于DLSS的具体问题进行了共识。共有46条治疗类和11个非治疗类的推荐意见或共识提出。

世界中医药学会联合会(世中联)指南共提出了8条中医治疗类推荐意见,包括内服中药、中医外治法及功法锻炼。丹麦国家临床指南提出了10个治疗相关的临床问题及相应推荐意见,其中7个临床问题与保守疗法有关,3个临床问题基于手术疗法展开讨论推荐。NASS指南提出了16个临床问题及相应的推荐意见,其中6个问题围绕DLSS的定义、病程、诊断及评价DLSS干预的临床结局指标展开,还有10个临床治疗类问题,有关保守治疗和手术治疗的临床问题数量比例为7∶3。加拿大骨关节协会的指南中提出了12个关于DLSS间歇性跛行的非手术治疗类临床问题及推荐意见。美国西弗吉尼亚州介入协会发表的共识中有11项共识,5项关于DLSS概念、诊断,4项关于手术治疗,2项关于非手术治疗。具体疗法的推荐意见见表5。

表5 各推荐疗法意见等级Table 5 Grade of each recommended therapy in five included studies

3 讨论

3.1 DLSS指南或共识基本情况 DLSS的严重程度与临床表现之间的相关性很差,在指南和共识[19,22]中也有提出,但是神经源性间歇性跛行却是DLSS的特征性临床表现。纳入的文献中加拿大骨关节协会指南围绕解决神经源性间歇性跛行这一主要困扰DLSS患者的症状为临床问题,其余纳入文献针对DLSS展开,提供诊断、影像学、治疗以及干预结局指标评定等方面的意见推荐。根据基于AGREEⅡ和RIGHT的质量和报告规范结果,纳入的文章中,指南的质量和报告规范远高于共识,基于循证制订的3篇指南的质量远高于非循证指南;基于现代医学的指南比中医类指南的质量和报告规范要高。

由此可见,想要让我国广大医疗工作者阅读指南后有更好的临床决策输出,亟需高水平、高标准的循证指南提出,特别是中医类指南。

3.2 DLSS相关指南或共识的质量分析 2019年我国发表的指南在AGREEⅡ和RIGHT评价方法学质量和报告质量相较于2014—2018年有了5%以上的提高[11],但我国指南与国际指南仍存在较大差距,指南评价的发展也推动着指南制订者对指南质量和报告规范的严格把控,促进着我国医疗指南制订的发展[11,23]。本研究采用AGREEⅡ评价指南和共识的质量,AGREEⅡ评价工具推断指南共识的制订方法和内容是否可靠,制订过程是否符合标准要求,推荐意见是否基于当前最佳证据总结得出、在临床推广必要与否[24]。

经AGREEⅡ评价后的结果显示,纳入的6篇文献中,基于循证的3篇指南在总分及各个领域中的得分较高,在范围和内容、制作严谨性和表达明晰性三个领域中均比其余3篇文献得分高。通过AGREEⅡ条目设定及评定情况,可见循证制订临床实践指南是当前的趋势[25],美国医学研究所(Institute of Medicine,IOM)2011年更新的临床指南定义——基于系统综述生成的证据对各种备选方案进行利弊评价和权衡之后提出的最佳推荐意见,可以看出指南应该是基于循证证据为基础而制订的[26]。且循证指南在制订过程中有严格且合理的评估程序,比传统的专家指南更为科学和系统[27]。在参与人员、应用性和编辑独立性这三个领域,所纳入的文献评分较低,均不足40.0%,说明在指南描述制订人员的专业,制定过程中所做贡献,选择临床问题时的意愿收集,指南适用人群,指南应用和推广中的影响因素,赞助资金来源、使用情况及利益冲突等方面还距国际公认的指南质量评价方法——AGREEⅡ量表中的相关要求有一定差距。在参与人员领域,是否参考了群众及目标群体的意见和意愿条目中,只有世界中医药学会联合会发布的指南中在制订推荐意见时考虑了患者意愿,可能碍于指南版面与字数要求,但不考虑指南主要目标人群——患者的意愿,确有悖于循证医学做寻求的三个立足点之一。大多的指南制订团队,对于指南面向适用人群后的推广及应用提及均甚少,在是否更新,何时更新等内容上,只有质量较好的2篇指南[19-20]中有提及。

就DLSS相关的指南或共识质量而言还可以进一步提升,以期为临床决策更好的服务。

3.3 DLSS相关指南和共识的报告规范分析 本研究基于RIGHT对纳入的文献进行报告规范方面的评级,作为国际上应用最多的指南报告规范标准,RIGHT条目不适用所纳入的大部分共识,且共识用大量篇幅讲述专家达成共识的过程,为了减少对其他纳入文献的影响,故只对4篇指南进行了RIGHT评价评分的汇总和分析。

RIGHT由基本信息、背景、推荐意见、证据、评审和质量保证、资金资助与利益冲突声明和管理及其他方面7个领域组成[12]。本研究经RIGHT评价后的4篇文献中有3篇指南总报告率超过了60.0%,世界中医药学会联合会发布的指南最终评级的比值最低只有34.3%。具体到各领域,资金资助与利益和推荐意见两个领域的评价最不理想,得分只有28.125%和44.650%。在资金资助与利益这一领域中,根据RIGHT具体要求,指南制订过程的各个阶段的资金来源均应在文中有透明公开表达[12],而所评指南对赞助资金的来源和使用虽有提及,但也只是用简单的语句描述指南制订的资助方,并没细化到具体制订阶段以及描述如何使用。在推荐意见领域,纳入的指南在意见形成原理及解释说明这一个条目中失分最多,评价标准要求不仅在意见推出的过程中要参考指南使用人群和目标人群的意愿,还需进一步考虑成本、资源利用、公平性、可行性及可接受度等因素的影响。可见,当前DLSS相关指南的报告规范据国际实践指南报告标准有很大差距,主要表现在RIGHT要求的分条目的描述上。可能评价结果不理想的指南因为篇幅较少,限制了一些信息的表达,但纳入指南中得分最高也只有72.9%,也说明了指南制订人员在指南制订过程中还需对报告规范有进一步提高。

3.4 DLSS相关指南和共识推荐意见分析 纳入且给出推荐意见的5篇文献中提出57条推荐意见,其中11条推荐意见关于DLSS的定义、诊断标准及疗效评价等内容,46条推荐意见关于干预方法。3篇循证指南[18-20]基于系统评级或者Meta分析给出推荐意见,并用GRADE评价证据等级,给出证据质量及推荐强度等级方法。

5篇文献给出了36个保守干预意见,证据数量最多的外治法是NASS指南和西弗吉尼亚州介入协会共识中提到的硬脊膜外类固醇注射,推荐等级为中推荐,且NASS还将时间限定在发病之初的24个月内,随着病程迁延对于此项治疗的推荐等级也在下降,在病程超过36个月之后降为不确定。只有中医指南给出了针灸及手法治疗具体的处方,其余提及的指南或共识以弱推荐[20]或不确定[19]呈现,其中加拿大骨关节协会的指南限定针灸只在发病初期使用并将手法治疗归属于康复治疗。2篇指南[17,20]为功能锻炼给出了弱推荐;1篇指南[19]不确定;丹麦国家临床指南关于功能锻炼作为干预手段给出了“倾向”的描述,又补充锻炼活动有利于神经源性疼痛治疗的证据支持不足,但对于术后锻炼给予了弱推荐。药物干预方面,中医指南对内服中药给予弱推荐;西医药物中,除NASS指南给营养神经药物不确定是否推荐和丹麦国家临床指南在疾病初期以弱推荐的等级推荐神经源性疼痛止疼药以外,其他文献均明确不推荐任何西医内服药物。

关于手术干预,丹麦国家临床指南对保守治疗效果不佳的患者,外科椎板减压术及椎体融合术给予弱推荐;NASS指南对中重度患者的手术治疗同样给出弱推荐。而西弗吉尼亚州介入协会共识用USPSTF给出的标准对经皮影像引导腰椎减压术强推荐。

DLSS较长的病程使得保守治疗不能立竿见影,对比指南发现,手术治疗可以迅速缓解症状,得到的推荐等级也较高,但神经损伤等并发症或复发率高,再手术率高,且价格贵、接受度低,故治疗策略又回到以保守治疗为先。NASS指南也提出非手术治疗也可以作为DLSS治疗的第一策略,所以以手术治疗作为保底方案,以保守治疗作为第一策略是符合患者意愿和当前最佳证据的治疗方案。而目前指南中对保守治疗的重视程度还有待提高,希望指南制订者增加保守治疗方案或组合从证据到推荐意见各个步骤的探讨,使指南的使用人群为患者做出最有利的临床决策。

综上,DLSS相关指南和共识方法学质量和报告规范还有待进一步提升,对于中重度腰椎管狭窄症患者指南给出的推荐意见倾向于手术治疗,在指南数量上,国内DLSS的指南较少。希望指南制订过程中,制订者严格按照AGREEⅡ和RIGHT的要求,制订出质量更高为临床医生和患者更好服务的循证指南。

作者贡献:陈红、王锡友、刘长信、张洋、于长禾提出研究思路,设计研究方案;安易、刘鲁平、雷园、孙艳艳负责数据收集、采集、清洗和统计学分析、绘制图表等;安易、周彦吉、陈千吉负责论文起草、撰写及修改;安易、于长禾负责最终版本修订,对论文负责。

本文无利益冲突。

猜你喜欢
共识循证指南
共识 共进 共情 共学:让“沟通之花”绽放
《循证护理》稿约
循证护理在新生儿静脉采血中的应用
论思想共识凝聚的文化向度
商量出共识
指南数读
论碰撞的混搭指南
循证医学的人文精神
“慢养孩子”应成社会普遍共识
循证医学在中医教育实践中的应用