121例肺结节患者的语音共振峰初探*

2019-04-20 02:28宋雪阳许朝霞王寺晶丁晓东王忆勤
世界科学技术-中医药现代化 2019年12期
关键词:元音共振证型

宋雪阳,许朝霞**,王寺晶,丁晓东,冯 路,王忆勤,张 勇

(1. 上海中医药大学基础医学院 上海 201203;2. 复旦大学附属中山医院呼吸科 上海 200032)

闻诊是中国传统医学宝库中的瑰宝,《黄帝内经·素问·阴阳应象大论》曰:“善诊者,察色按脉,先别阴阳;审清浊,而知部分;视喘息,听声音,而知所苦”[1]。闻诊分为听声音与嗅气味两部分,其中听声音即声诊。《难经》第四十难言:“金者肺,肺主声,故令耳闻声”[2]。故声诊与中医肺系疾病关系最为密切。肺结节是随现代科技发展而发现的疾病,也属于中国传统医学中肺系疾病的范畴。肺结节指肺内直径小于等于3cm 的病灶,呈类圆形或不规则形,临床根据其密度分为实性结节、部分实性结节和磨玻璃密度结节,其中部分实性结节恶性概率最高,另两者次之[3]。肺癌作为我国最常见的肿瘤之一,早诊断早治疗极为重要,故对肺结节进行有效地诊断与筛查非常关键。

呼吸器官、喉头、咽头、口腔与鼻腔五者共同组成语音生理基础,当发元音时,声带振动产生基频,发声器官谐振则形成共振峰,基频是由肌肉、软骨各种动作支配主动形成的,而共振峰则是被动地由发声器官的形状决定[4]。共振峰的形成首先由声带振动后形成声带波到唇边辐射波,整个发声器官形成一个共振系统,由于声腔的特点不同,各群谐音波强烈传递后,在不同声音中形成不同的能量集中区域,这些能量集中的区域就是共振峰。本研究运用现代的客观化语音采集及分析方法,在中医辨证分型理论的指导下,观察并分析肺结节患者发元音时语音共振峰特征,为肺结节的诊断筛查提供新思路。

1 资料与方法

1.1 一般资料

本研究所有病例来源于2017 年1 月至2017 年10月间复旦大学附属中山医院呼吸科门诊、上海中医药大学附属曙光医院呼吸科门诊及病房、上海中医药大学附属岳阳中西医结合医院和上海市强生职工医院中医内科门诊,肺结节患者病例共121 例。正常对照组为上海中医药大学在校健康学生、职工以及上海市老教授协会志愿者,共36例。

1.2 病例选择标准

1.2.1 诊断标准

肺结节诊断参照《中国肺部结节分类、诊断与治疗指南(2016 年版)》[3];中医辨证参照《中医诊断学(第2版)》[5]教材辨证标准,分为虚证、实证和虚实夹杂证。

1.2.2 纳入标准

肺结节组:①符合以上诊断标准,经胸部电子计算机断层扫描(Computed Tomography, CT)、低剂量螺旋CT(low dose CT, LDCT)或正电子发射计算机断层显像扫描(Positron Emission Computed Tomography-CT, PET-CT)检查,证实为肺结节的患者;②年龄、性别不限;③根据以上证型诊断标准,经由两名副高以上职称的中医师判读,取结果一致者;④知情同意。

正常对照组:①无明显呼吸系统疾病者;②无严重心、肝、肾等器质性疾病者;③年龄、性别不限;④知情同意。

1.2.3 排除标准

不符合上述的纳入标准者;合并严重心、肝、肾等器质性疾病者;已经确诊为肺癌者;发声障碍者;拒绝配合者。

2 研究方法

2.1 语音采集

采用Jabra UC Voice 550 MS Mono 耳麦一体式电熔话筒,利用上海中医药大学与上海亚太计算机信息系统有限公司联合研制的SmartTCM-1 型中医生命信息分析系统的声诊模块,在噪音小于45 分贝的环境内,嘱受试者以正常说话的方式自然地分别发声元音[a]和元音[e],以16 kHz 采样频率进行录音,保存为16bit采样位数的wav格式音频文件。

语音信号采集质量直接关乎研究数据的准确性,可以从以下各方面提高语音信号质量。较为安静的环境能够明显降低噪音对语音信号的干扰;同时由于语音具有社会性,过于嘈杂的环境会对受试者情绪产生影响,对语音本质形成干扰;使用心型指向或者超心型指向的录音设备可以有效减少来自周围的噪音,追求最优化甚至可选用枪型指向的录音设备。由于共振峰的频率最大时接近5000 Hz,根据采样定理,语音信号采集时采样频率至少需要10 kHz,本研究则采用16 kHz采样频率以保证准确性,若是需要分析频率更高的语音信号,则需相应提高采样频率。

表2 肺结节患者不同证型分布情况

2.2 语音分析

声音起于声源振动,语音则源于声腔振动,语音的共振峰则是整个声腔振动的反映。共振峰与语音的生理基础存在一定关系,不同共振峰受到开口度大小、舌位等发声器官影响,也与音色等语音信息相关[6]。本研究将wav 格式的音频文件导入Praat 6.0.34语音分析软件,提取受试者发声时声腔的共鸣频率,即第一共振峰(First Formant, F1)、第二共振峰(Second Formant, F2)、第三共振峰(Third Formant,F3)、第四共振峰(Fourth Formant, F4),共计四个反映语音特征的指标。

语音信号的预处理可以针对一段声音波形,精确选择起始端点与结束端点,从而准确地截取语音信号的有效部分,良好的预处理不仅能够去除不必要的噪音,同时能保证截取语音信息的一致性,增加研究结果的可靠性。

2.3 统计学方法

本研究采用SPSS 21.0软件,采用秩转换的非参数检验方法,对121 例肺结节患者和36 例正常人语音样本中元音[a]与元音[e]的各四个共振峰,总计八个共振峰频率参数进行统计学分析,多类比较使用Kruskal-Wallis H检验,两两比较使用Nemenyi检验,P <0.05表示差异具有统计学意义。

3 结果

3.1 基本情况及证型分布描述

由表1、表2 可见,肺结节患者病例共121 例,平均年龄56.99±12.21岁,男女比例为1∶1.9,其中虚证41例,实证30 例,虚实夹杂证50 例。正常对照组共36例,平均年龄54.58±22.25 岁,男女比例为1∶1.8。患者组与正常对照组之间年龄、性别无统计学差异(P >0.05)。

表3 肺结节患者与正常组语音(元音[a])共振峰频率比较()

表3 肺结节患者与正常组语音(元音[a])共振峰频率比较()

?

表4 肺结节患者与正常人语音(元音[e])共振峰频率比较()

表4 肺结节患者与正常人语音(元音[e])共振峰频率比较()

注:与正常组比较,*P <0.05

?

表5 不同证型肺结节患者组及正常组间语音(元音[a])共振峰频率比较()

表5 不同证型肺结节患者组及正常组间语音(元音[a])共振峰频率比较()

?

表6 不同证型肺结节患者组及正常组间语音(元音[e])共振峰频率比较()

表6 不同证型肺结节患者组及正常组间语音(元音[e])共振峰频率比较()

注:与虚实夹杂证组比较,*P <0.05;与实证比较,#P <0.05

?

3.2 肺结节患者语音共振峰与正常组语音共振峰比较情况

由表3、表4 可见,语音共振峰的分布有一定区域性,本研究中肺结节患者元音[e]的F1 分布区间为332.04 Hz 到731.88 Hz,均值为540.95 Hz;正常人元音[e]的F1 分布区间为440.86 Hz 到813.77 Hz,均值为592.67 Hz。由表1、表2 可见,肺结节患者组与正常对照组之间元音[e]的第一共振峰差异(P=0.019 <0.05)具有统计学意义。元音[a]各共振峰在肺结节患者与正常组间则无统计学差异(P >0.05)。

3.3 肺结节患者虚证、实证、虚实夹杂证及正常组语音共振峰比较情况

由表5、表6 可见,肺结节患者不同证型间语音共振峰比较,发现实证患者元音[e]的F3从2148.90 Hz到3189.97 Hz 均有出现,其均值为2768.74 Hz;虚实夹杂证患者元音[e]的F3 区间为1823.35 Hz 到3549.79 Hz,共振峰均值为2934.83 Hz;经统计学分析,肺结节实证与虚实夹杂证患者之间元音[e]第三共振峰差异(P =0.023 <0.05)具有统计学意义。虚证患者元音[e]的F4区间为3267.52 Hz 到4572.66 Hz,均值为3997.87 Hz;实证患者肺结节患者元音[e]的F4 范围则是3265.71 Hz 到4488.95 Hz,均值为3782.41 Hz;经统计学分析,虚证与实证患者之间元音[e]第四共振峰差异(P =0.014 <0.05)具有统计学意义。元音[a]各共振峰在不同证型肺结节患者与正常组间均无统计学差异(P >0.05)。

4 讨论

《医宗金鉴》对于人体发声器官的描述记载为“中空有窍,故肺主声。喉为声路,会厌门户。舌为声机。唇齿扇动,宽隘锐钝,厚薄之故”[7],可见清朝对于闻诊的生理基础已经有所研究。本研究以元音作为语音采集的目标,所观察的语音共振峰虽不属于语音四要素,但能有效反映发声器官的特点。对于肺结节患者,与正常人语音差异集中在元音[e]上,主要体现于第一共振峰,且肺结节患者的第一共振峰范围高于正常人的第一共振峰范围。不同证型的肺结节患者语音差异集中于元音[e],实证与虚实夹杂证患者区别于第三共振峰,而实证与虚证患者语音共振峰则区别于第四共振峰。与之相应的是元音[e]中第三共振峰上实证与虚证并无差异,第四共振峰上虚证与虚实夹杂也未出现差异,提示元音[e]的第三共振峰与第四共振峰对肺结节患者实证语音特点区别度较高。本研究中,共振峰频率差异仅在元音[e]中出现,或与两个元音间发音的生理区别相关。就口腔的开合区分,[a]属于开元音,口腔开度大,舌位较低;[e]则是半闭元音,口腔开度较小且舌处于半高位。就圆唇与不圆唇而言则两个元音都属于不圆唇[8]。共振峰中受舌位高低影响的是F1,而圆唇与不圆唇则同时影响F2和F3,影响共振峰数据更为直接的是前后腔比例[6]。肺结节患者的语音特征是否受到舌位影响,何种发声方式能更好地表现肺结节患者语音共振峰特征,尚需进一步研究。

语音的四要素分别是音高、音强、音长和音色,临床上医生对语音的判别更多集中在音强与音高方面,例如虚证患者多有声低气怯,主要是语音响度较低,反映在音强方面则是虚证患者音强低于常人;音高则更多反映男女语音的区别,女性语音频率较高,男性较低,则在音高上两者形成差异,此类判别大多较为主观。语音共振峰的细节差异人耳较难辨认区分,需要借助仪器进行分析,可谓是声诊中的微观辨证,遇到肺结节患者证候不明显或是证候较为复杂时,能够发挥微观辨证的优势,为辨证提供参考依据。有研究显示,除证候特点之外,声诊的语音信息还能反映五脏特点,为脏腑辨证提供客观依据[9-11]。

肺结节是由影像学检查发现,临床多无明显症状体征,语音共振峰还可以同影像学检查结合,针对肺结节类型、肺结节大小以及肺结节位置与语音共振峰之间相关性进行研究,对于肺结节的诊断筛查,乃至肺癌的预警都是极有价值的。依据肺结节类型、大小、位置等影像学表现进行分组,结合语音共振峰以及其他语音特征进行分析,是本课题组今后研究的方向。声诊研究属于闻诊的一环,而闻诊在中医四诊研究中尚处于薄弱的环节,声诊研究一方面需要现代科学技术支撑,另一方面也需要中医基础理论支持。两方面齐头并进,声诊才能有长足发展。本研究以肺结节为研究病种,将共振峰作为观察指标,通过中医辨证理论,希望能够为中医声诊发展提供基础,同时也抛砖引玉,为闻诊客观化研究做出一点贡献。随时代发展,科技进步,语音信号处理模拟信号与数字信号的转换都将更为先进,数据挖掘技术也将更为广泛,声诊研究更需要融合新技术,方能在客观化与标准化的道路上创新迈进。

猜你喜欢
元音共振证型
基于因子分析及聚类分析的241例感染后咳嗽中医证素证型研究
元音字母和元音字母组合的拼读规则
基于自适应矩估计的BP神经网络对中医痛经证型分类的研究
ZJP56型组合绳锯组锯机超谐共振分析
元音字母和元音字母组合的拼读规则
安然 与时代同频共振
选硬人打硬仗——紫阳县党建与脱贫同频共振
辨证针刺治疗不同证型干眼的疗效观察
改革是决心和动力的共振
Playing with “ar”