耳鸣评价量表的临床应用

2019-01-15 01:03刘蓬郑芸

中国听力语言康复科学杂志 2018年6期

刘蓬郑芸

临床医生接诊耳鸣患者，首先面临其程度评估的问题，耳鸣需要什么干预方法？干预后效果如何？这是临床医生面对耳鸣患者必须考虑的问题，因此，选择合适的耳鸣评估工具，对耳鸣严重程度作出符合实际情况的评估，是诊治耳鸣所必须的。

近20多年来，源自国外的众多耳鸣自评量表（self-report tinnitus questionnaire，SRTQ）渐渐成为国内外文献报道中使用较多的耳鸣疗效评价工具，但这类评估工具的可靠性值得商榷[1]。研究显示，国内应用较多的SRTQ之一的中文版耳鸣残疾量表（tinnitus handicap inventory，THI）有些条目并不能被患者正确理解，因而评估的结果不一定能真实反映患者的耳鸣程度[2]。SRTQ是由专职研究人员而不是临床医生研发，研究者对临床医生的需求并不十分了解，多数SRTQ比较复杂，而医生的诊务工作非常繁忙，因此极少有临床医生将SRTQ作为常规耳鸣评估工具在临床上使用，一般仅在进行某项研究时才临时使用，即临床医生对SRTQ中各条目并不十分熟悉，因此，医生和患者都不够熟悉的情况下，问卷填写结果的可信度自然是值得怀疑的。

耳鸣评价量表（tinnitus evaluation questionnaire，TEQ）是由中国临床医生在长期的耳鸣实际诊疗工作中研发出的耳鸣评估工具[3]，较之以THI为代表的SRTQ不仅使用简洁、方便，即使在繁忙的诊务工作中，亦可作为临床医生的常规评估工具应用于耳鸣患者的初诊和复诊中，且评估结果准确、可靠。

1 TEQ的研发特点

1.1 条目的来源

SRTQ条目数多少不一、表述语句不同、计分方法有异，但总体研发思路基本是一致的，即所用的基本条目池来源于少数样本患者以书面的方式写出的针对耳鸣的抱怨[4]，然后应用统计学方法进行筛选。患者对耳鸣的认识有很多是错误的，基于错误的认识对耳鸣产生的抱怨有很多是偏离实际的，与耳鸣的严重程度之间并无必然联系。

与SRTQ的研发思路不同的是，TEQ的条目设计并非直接取材于患者的抱怨，而是基于临床医生在长达6年时间里与1000多例不同类型的耳鸣患者面对面的深度交流，在了解不同患者抱怨的基础上，进一步根据医生对耳鸣的系统认识结合文献调研对患者的抱怨进行深入分析，剔除了与耳鸣严重程度无关的一些抱怨，逐渐筛选出能代表耳鸣严重程度且易于被医生掌握的共性指标[5]，进而研究这些指标的科学计分方法[6]，最后将指标转变为6个问题形成TEQ[3]。TEQ的形成过程如图1所示。

图1 TEQ的形成过程

1.2 问卷包含的范围

对耳鸣的评估包括两个方面：一是对耳鸣的感知，二是对耳鸣的反应。前者是基础，后者是基于前者所继发的问题，两个方面缺一不可。

在20多种SRTQ中[1]，除耳鸣功能指数（tinnitus functional index，TFI）[7]等极少数SRTQ含有对耳鸣感知的问题外，包括THI在内的绝大多数SRTQ只包含对耳鸣的反应。作为评估耳鸣严重程度的工具，这是不够全面的。有人认为耳鸣一旦形成，就不可能变化，这可能是多数SRTQ对耳鸣的感知不纳入评价的原因之一，但这种认识是不符合实际的。有报道显示，对耳鸣患者的长期随访中，有21.5%的耳鸣在5年后可自发消失[8]，说明耳鸣并非一成不变的。笔者在对耳鸣患者的长期临床观察中亦发现，耳鸣的响度及持续时间会随着某些因素的改变而发生变化，例如睡眠不足或疲劳时耳鸣的响度会增大，改善睡眠后或经过某些治疗措施后耳鸣的响度会降低，甚至会暂时停止，由持续性耳鸣变为间歇性耳鸣。如果耳鸣的评估工具中没有包含对耳鸣的感知，则不能反映出这种变化。

耳鸣的治疗目的是改变对耳鸣的感知和改变对耳鸣的反应。一切药物治疗、经颅磁刺激（transacranial magnetic strmulation，TMS）、电磁疗法、电刺激等治疗方法的目的都是试图改变对耳鸣的感知；而要改变对耳鸣的反应主要靠教育及心理行为学治疗方法，如认知行为疗法（cognitive behavioral therapy，CBT)、接受与承诺疗法（acceptance and commitment therapy，ACT)、习服疗法（tinnitus retraining therapy，TRT）等。前者的治疗周期一般较短，后者较长。后一类的治疗方法，应用SRTQ去评估疗效也许有一定的可取之处；而前一类的治疗方法，应用只包含对耳鸣的反应的SRTQ评估疗效则未必是恰当的，这可能是某些治疗方法在不同作者得到相互矛盾结论的原因之一，例如应用THI评价褪黑素对耳鸣的治疗作用，有人报道有效[9]，也有人报道无效[10]。对rTMS治疗耳鸣也有不少类似相反结论的报道[11，12]，这种矛盾的结论可能有方案设计等方面的原因，但疗效评价方法是否合理也是不容忽视的原因之一。

TEQ尽管只有6个问题[3]，却包含了对耳鸣的感知及对耳鸣的反应两方面的内容，且对耳鸣的反应基本囊括了几乎所有SRTQ中真正与耳鸣严重程度相关的内容，较全面反映耳鸣的严重程度及其变化情况，因此适合于评估任何治疗方法对耳鸣的疗效。

1.3 信息的采集方法

采集信息的方法是否恰当，对于评估结果是否准确、可靠至关重要。SRTQ的信息采集方法一般是将书面问卷让患者自行填写，这种方法由于不同患者自身条件的限制可能带来答案的不确定性[2]、反复填写问卷给患者带来的厌倦甚至可能产生的负面影响是值得考虑的[2]。与此不同的是，TEQ的信息采集方法是由医务人员与患者交流后进行评分，可以有效避免自填问卷的缺陷，医务人员理解TEQ6个问题的核心后，针对不同文化程度的患者可以灵活运用患者能理解的语言进行询问以获取真实的答案，使收集的信息更加准确、可靠[3]。由于TEQ的6个问题都是临床医生面对耳鸣患者时必须了解的，可以与临床问诊有机结合在一起，不需要增加额外的工作量，因此，每次复诊都可以进行评估，便于医生随时了解治疗的效果，无论评估多少次都不会使患者产生厌倦情绪或负面影响。当然，由医务人员采集信息可能带来的一个问题是：在临床研究中可能会存在一定的主观性偏倚，使治疗组与对照组的结果比较在某种程度上降低其公正性。但是，采用盲法评价则可有效避免这一问题，即在正式的临床研究中可采用不参与治疗、也不知道分组的第三方进行TEQ评价。TEQ与SRTQ在研发思路上的主要区别见表1。

2 TEQ的应用性研究

2.1 TEQ的信度

信度是评价一个测量工具可靠性的重要指标。从两个方面研究TEQ的信度，即内部一致性信度与重测信度。

2.1.1 内部一致性信度以Cronbach's α为指标，系数越大，表示条目间的相关性越好。一般而言，系数＞0.7被认为量表内部一致性信度好[13]，但本系数的大小与量表条目数量有关，条目少会降低Cronbach’sα系数。TEQ仅有6个条目，先后由两个不同单位通过202例及414例耳鸣患者的研究，Cronbach’sα系数分别为0.76[14]及0.79[15]，说明量表的各个条目具有较好的内部一致性信度。

2.1.2 重测信度重测信度是考察外部信度常用的方法，即在观察对象的病情没有改变的情况下，在不同时间内用同一工具进行重复测量，用两次测量结果的相关系数来表示重测信度，相关系数越大，表示重测信度越高。研究重测信度的前提是研究对象的病情没有发生变化，对耳鸣评估工具来说，必须在确保耳鸣严重程度没有变化的情况下研究重测信度才有可靠的结果。有作者研究耳鸣残疾问卷（tinnitus handicap questionnaire，THQ）的重测信度，两次测试间隔时间达1个月[16]甚至6～8周[17]，在这么长的时间里很难保证患者耳鸣程度不发生变化，如果耳鸣程度发生了变化，而两次测试结果却显示差异很小，说明测量工具本身的信度不可靠。对于SRTQ来说，由于患者自行填写答案，如果两次测试间隔时间太短，可能存在记忆效应的问题。因此，研究重测信度时，确定两次测试的合理间隔时间并非易事：既要保证耳鸣程度本身不发生变化，又要避免患者的记忆效应。大部分已发表的SRTQ在研究重测信度时仅考虑了后者，而忽视了前者。

在研究TEQ的重测信度时，选择在门诊就诊的病例，在首次问诊时由医生进行第一次TEQ评估，经过一系列的临床检查后再由医生进行第二次TEQ评估，两次评估的间隔时间在1～3小时内，此期间未经医生的解释和干预，可以确保患者的耳鸣程度不会发生变化，如果两次测试结果的差异很小，说明测量工具本身的信度是可靠的；而由医生用不同的语言询问患者后进行评分的方式，也不会产生患者的记忆效应问题。应用此方法先后由不同单位的研究组通过202例、96例及414例耳鸣患者进行过3次研究，重测信度分别为0.938[14]、0.94[18]及0.97[15]，3次的研究结果非常接近且十分理想，表明TEQ评估结果具有良好的稳定性及可靠性。

2.2 TEQ的效度

效度是评价一个测量工具有效性的重要指标，体现测量工具与测试对象的真实性相符合的程度。我们以汇聚效度作为研究指标进行考察，选择了目前文献中应用最多的THI作为对照量表，研究TEQ与THI的相关性。先后在两个单位进行了4次研究：第一次（2009年）经219例研究，TEQ与THI的相关系数为0.73[19]；第二次（2012年）经202例研究，二者的相关系数为0.769[14]；第3次（2017年）经187例研究，二者的相关系数为0.79[8]；第4次（2018年）经414例研究，二者的相关系数为0.78[5]。4次的研究结果十分接近，说明二者的相关程度是较好的。而TEQ的平均评估时间仅3.27 min，较THI的平均评估时间11.17 min缩短了2/3[8]，在临床医生繁忙的日常工作中，选用TEQ作为评估工具可以得到较为准确的结果，并大大节约评估时间。

表1 TEQ与SRTQ在研发思路上的主要区别

2.3 TEQ的反应度

反应度是评价一个疗效测量工具敏感性的重要指标，即测量对象发生变化时，应用测量工具能否及时测量出这种变化的能力。效应量（effect size，ES）是考察反应度的一个重要指标[20]，ES值越大，反应度越好，一般来说ES大于0.8就很理想了。关于TEQ的反应度，先后通过治疗前后的57例与173例研究，结果自觉改善组的ES分别达到1.04[18]与1.90[15]，显示TEQ具有非常理想的反应度，能够及时反应耳鸣程度的变化。

2.4 TEQ的最小临床有意义变化值

最小临床有意义变化值（minimum clinical meaningful score change，MCMSC）是作为疗效评价工具的一个重要指标[20]，其意义在于为临床医生提供一个判断有效与否的参考指标，即应用此评价工具时，分值变化多少可以判定为有效。计算MCMSC主要有95%CI法、1/2 SD法等方法。其中，95%CI法为最常用的方法[21]，其原理是基于两次重复测试结果，计算出测试误差的最大允许范围，超过此范围即被视为病情的真实变化。有研究表明，慢性疾病的健康相关生活质量的MCMSC与基线评估的1/2 SD十分接近[22]，因此也可以通过计算基线的1/2 SD来估计MCMSC。对173例经过治疗的耳鸣患者分别应用95%CI法及1/2 SD法两种方法进行了测算，得到TEQ的MCMSC值分别为1.85分与1.88分[15]，两种方法得到的结果非常接近，而THI分别应用以上两种方法得到的MCMSC值分别为20分[23]与7分[24]，差异很大，说明TEQ的MCMSC值较THI更稳定，因而更适合用于疗效评价。由于TEQ的分值为整数，因此，临床上如果治疗前后TEQ分值变化达到2分以上，可视为耳鸣程度发生了变化（即有效）而不是测试的误差。

2.5 基于TEQ的耳鸣程度分级

依据TEQ总分将耳鸣程度分为5级：Ⅰ级1～6分，Ⅱ级7～10分，Ⅲ级11～14分，Ⅳ级15～18分，Ⅴ级19～21分。先后在不同单位通过219例[19]及414例[15]耳鸣患者研究表明，这种分级具有良好的区分度，对临床干预措施的选择具有实际指导意义。一般来说，临床上求医的耳鸣患者以Ⅱ～Ⅳ级为多见，占90%以上[15，19]。

3 TEQ的临床应用

作为一种科学而实用的评估工具必须满足两个条件：一是准确可靠，反复使用时误差尽可能小；二是使用方便，符合临床医生日常诊疗工作的需要。TEQ作为耳鸣严重程度评估工具符合以上两个条件。近10年里，笔者在临床诊疗工作中每天都在应用于耳鸣评估，目前已有超过万例的应用经验。TEQ具有如下优点。

第一，全面而简洁。目前源自国外的多数SRTQ条目数很多[1]，填写费时，且均局限于患者对耳鸣的不良反应，没有包含对耳鸣的感知。TEQ虽然只有简单的6个问题，却完整地包含了以上两个方面的内容，且吸收了患者对耳鸣程度总体印象评价的指标，评估耳鸣严重程度更为全面。TEQ一般在2～4分钟可完成评估，适合于繁忙的临床诊疗工作中作为常规应用。

第二，准确而可靠。TEQ的问题设计基于医生对耳鸣的系统认识而非直接取材于患者的抱怨，使问题本身能真实反映耳鸣的严重程度，杜绝了多余的问题。由医务人员根据6个问题的实质与患者交流后进行评分而非由患者自行填写的方式，确保了评分准确而可靠，在每次的复诊与随访中随时可应用，且避免了患者反复填写问卷可能带来的负面影响。

第三，便于耳鸣程度分级。面对一个耳鸣患者，通过简单的交流很快得出TEQ评分并对严重程度作出分级，医生根据分级情况选择是否需要临床干预，十分方便。对于耳鸣流行病学调查来说，取得耳鸣严重程度分布的数据亦非常便捷。

第四，便于评价疗效。应用TEQ评价疗效可采用两种方式：一是根据治疗前后耳鸣程度分级的变化，降低一级以上可视为有效[6]；二是根据治疗前后TEQ总分值的变化，降低2分以上可视为有效[15]。

TEQ是基于中文语境下历时多年研发供临床医生日常使用的耳鸣评估工具，在多年的应用实践中已显示出良好的临床应用优势。2008年世界中医药学会联合会耳鼻喉口腔科专业标准审定委员会及中华中医药学会耳鼻喉科分会确定以TEQ作为耳鸣程度分级与中医药治疗耳鸣的疗效评定标准[25]；2012年由中华耳鼻咽喉头颈外科杂志编委会耳科专业组组织的全国耳鸣专家共识会推荐应用TEQ作为耳鸣流行病学调查及疗效评价标准[26]。因此，TEQ已成为国内中、西医界一致推荐使用的耳鸣程度与疗效评价标准。至于在英语及其他语种环境下的应用价值如何，尚有待于进一步研究。