基于功能连接的大脑年龄预测的影响因素

2021-08-18 10:04周震王洪景斌
北京生物医学工程 2021年4期
关键词:全脑图谱年龄

周震 王洪 景斌

0 引言

随着医疗水平的进步,人类寿命得到了显著的提高,但随之而来的老龄化问题也日益严重。阿尔兹海默病(Alzheimer disease,AD)是一种常见的老年疾病,对个人、家庭、社会造成了严重影响,但目前尚无对其进行有效治疗的方法,临床关注的重点是对其进行早期干预和早期治疗。筛选阿尔兹海默病高危人群的关键在于判断大脑的老化情况,也就是大脑的“脑龄”,健康老年人有着正常的老化速度,而阿尔兹海默病的高危人群则显示出加速的老化速度,因而目前急需一种能够对大脑年龄进行客观估计的方法。

磁共振成像(magnetic resonance imaging,MRI)作为一种能够对大脑功能和结构信息进行无损检测的工具,已在临床上有了广泛的应用。静息态功能磁共振成像 (resting-state functional MRI,rs-fMRI)能够记录大脑在静息状态下的功能信息,具有操作简单、易被接受的特点,是目前老化研究中的主要工具,并已在脑龄的估计上取得了很多成果[1-2]。目前对脑龄的研究还主要集中在结构态MRI[3-6]上,只有少数研究探索利用rs-fMRI[7-9]对大脑年龄进行评估。这一方面在于结构项有着更好的空间分辨率,另一方面也在于fMRI作为一种四维的数据,具有很高维的数据量,如何从海量特征里筛选出有效的功能特征进行预测是一个很有挑战的问题。此外,目前在年龄估计的研究中,很多研究都集中在青中年的年龄段,因为这个年龄段有着非常丰富的开源影像数据,但在实际筛选AD的高危人群上,还没有模型能够对中老年健康人的脑龄进行针对性的预测评估。

在已有利用静息态功能连接特征进行年龄预测的文章[7]中,特征筛选仅仅是在训练组中筛选出与年龄相关的功能连接作为特征,但这些特征实际上泛化性很差,在不同的数据集上很难重复,并且筛选后的特征依旧冗余,易导致在后续机器学习建模过程中出现过拟合。因此本研究旨在利用最新提出的一种基于Bootstrap的方法[10]进行特征筛选,使用筛选出的在不同训练子集上可泛化的且更简约有效的特征进行构建模型,从而实现一种面向中老年年龄段的健康受试者的年龄估计模型,并探索大脑模板、全脑信号回归及性别因素等对预测模型性能的影响,进而确定出一种最佳的年龄预测模型。

1 研究方法

1.1 研究对象

本文研究对象来自阿尔茨海默病神经影像学计划(Alzheimer disease neuroimaging initiative,ADNI)数据库,共选取42例正常人的rs-fMRI数据。其中男性16人,女性26人。所有数据皆是在Philips 3.0T MRI下扫描,所有受试者皆满足各项认知评分[蒙特利尔认知评估量表 (Montreal cognitive assessment ,MoCA),简易精神状态量表 (mini-mental state examination,MMSE)]对健康受试者的要求。在数据质量初筛后,删去1例失真严重的功能影像数据,最后剩余41例,其中15例为男性,年龄为66~90(78.7±6.2)岁;26例为女性,年龄为65~95(74.8±6.8)岁。rs-fMRI参数如下:140个时间点, 脉冲重复时间3 000 ms,回波时间30 ms,翻转角80°,扫描层数48,层厚=3.3 mm,扫描矩阵64×64。结构态MRI描参数如下:脉冲重复时间2 300 ms,回波时间2.98 ms,扫描层数170,扫描矩阵256×256,层厚 1.2 mm,翻转角 9°。

1.2 数据预处理

所有功能数据都利用软件DPABI(http://www.rfmri.org/dpabi)进行预处理,其处理过程主要包括层间时间较正、头动校正、协变量回归、空间标准化、滤波、平滑等。其中,层间矫正前去掉最开始的10个时间点的数据,以去除开始扫描时机器不稳定造成的影响。头动矫正时所有受试需满足2 mm或者2°的筛选条件,且对逐帧位移(framewise displacement,FD)>0.5的时间点数据进行删除,最终所有受试剩余时间点需大于100。空间标准化是通过将个体功能项先配准到个体结构项,再配准蒙特利尔神经学研究所(Montreal Neurological Institute,MNI)标准空间的方式实现。协变量回归变量包括线性漂移、白质、脑脊液、24头动参数。另外,考虑到全脑信号回归仍是一个有争议的步骤,本研究将分别采用全脑信号回归及未回归两种形式。滤波将采用0.01~0.1 Hz带通滤波,平滑核为4 mm×4 mm×4 mm半峰全宽(full width at half maxima ,FWHM)的高斯平滑。本研究将采用4种常用的脑分区模板进行功能连接的计算,包括AAL-90、AAL-1024、Shen-268、Fan-246,先提取出相应脑区的时间序列信号,然后利用Pearson相关计算脑区之间的功能连接,随后将得到的功能连接矩阵利用Fisher变换转换成Z值矩阵。

1.3 年龄预测模型构建

提取功能连接矩阵后,由于特征非常高维且冗余,采用一种新提出的基于Bootstrap的特征筛选方法,该方法能有效解决常用的相关分析筛选特征的不足,极大提高筛选特征的可靠性并可进一步特征降维。Bootstrap中有3个常用的参数:

(1) 抽样子集占数据集的比例,即有多少样本用来构建抽样的样本集;

(2) 抽样的次数及方式,即执行多少次有放回或无放回的抽样;

(3) 抽样子集提取的特征出现的频率。

设采样次数为10次,无放回抽样,每次抽样比例为80%,特征出现的频率为大于等于7,即在10次抽样中至少被筛选出7次的特征。

利用支持向量回归的方法构建预测模型。在建立模型时,首先构建无全脑信号回归,无性别分组的4个大脑模板下的年龄预测模型[图1(a)]。采用留一法(leave-one out)进行交叉检验,即每次使用数据集中的一个样本当作测试数据,而数据集剩下的数据作为训练数据,重复训练直到所有的样本都被测试检验过。仅在训练集中进行特征筛选,将功能连接和年龄做Pearson相关分析后具有显著相关(P<0.05)的功能连接作为候选特征,随后利用Bootstrap方法对候选特征进行二次特征筛选。将筛选后的功能连接特征输入到支持向量回归模型中,模型内的参数lambda将通过内部的5折交叉检验在[2-10,2-9,…,210]范围内寻优,从而确定4个模板下的最终模型。最后,对4个模板下具有最优性能的模型分别进行全脑信号回归,对性别分组后的模型[图1(b)]性能进行比较。模型将采用预测年龄与真实年龄的r值进行评价,r值越接近1,模型预测性能越好。

图1 年龄预测模型Figure 1 Age prediction model

2 结果

在4种大脑模板AAL-90、AAL-1024、Shen-268、Fan-246下,所建立的大脑年龄预测模型的相关系数r分别为0.23、0.29、0.17、0.38(图2),其中利用Fan-246脑图谱所建立的大脑年龄预测模型的相关系数r最高。

图2 四种大脑图谱下的年龄预测模型结果Figure 2 Age prediction results with four brain atlases

此外,大脑信号回归后的数据利用Fan-246大脑模板再次进行模型构建,结果得到显著提高,r值达到0.66。如果再利用性别信息分别构建年龄预测模型,不论全脑信号回归(global signal regression,GSR)与否,年龄预测模型的r都是0.46,较最原始模型的性能稍有提高,但仍低于只做全脑信号回归后的结果,这3种模型的散点图见图3。

图3 不同影响因素对预测模型性能的影响Figure 3 Influences of different factors on prediction performances

3 讨论

本研究利用rs-fMRI的功能连接特征进行大脑年龄的预测,结果表明在Fan-246大脑图谱下,经过全脑信号回归且性别未分组的年龄预测模型取得了最佳的识别性能,相关的r值达到0.66,从而表明rs-fMRI可以作为大脑年龄估计的一种有效的工具。

预处理时回归全局信号,在Fan-246脑图谱下的年龄预测模型的预测相关系数r提升为0.66,而未回归全局信号时其相关系数r仅为0.38,预测效果提升明显。据报道全局信号与头部的运动、呼吸和心律相关[11-13],因此,全局信号回归在去除由运动和其他生理噪声引起的全局伪影方面非常有效,从而提升模型的预测性能。本文在全脑信号回归上的发现也与前文报道的结果类似,这也提示在今后的预测研究中,全脑信号回归是一个必要的步骤。

不同大脑图谱对大脑年龄预测效果是不同的,原因在于不同脑图谱模板对全脑划分的依据是不同的。比如AAL-90脑图谱[14],是在一个人的全脑图像上进行划分,因而很难具有人群的代表性。AAL-1024脑图谱是将AAL脑图谱随机生成等大小的区域,虽然消除了脑区大小的影响,但也失去了分区的特异性信息,因此这两种模型的预测效果都比较差。Shen-268脑图谱[15]是对功能连接进行聚类产生的模板,但由于fMRI信号较差的可重复性,因而小样本下的聚类模板很难推广到其他人群。Fan-246脑图谱[16]既考虑分区间的结构相似性又结合了分区间的功能相似性,因而在本研究中被证明具有最佳的识别性能。

性别因素对年龄估计的影响不是很明显,相对于未性别分组的模型,性别分组后预测性能r从0.38提升到0.46,但相较使用全脑信号回归但未性别分组的模型性能(r=0.66)还有较大差距。另外,在全脑信号回归基础上再进行性别分组的性能(r=0.46)也没有提升,这表明性别分组对经过全脑信号回归的预测模型并无益处,一个可能的原因是不同性别的受试人数有所差异,导致在性别特异的模型下性能不够理想。但整体来说,性别依旧在大脑发育及老化过程中发挥独特的作用,在未来有足够样本量的情况下,性别分组应该会对大脑相关功能的预测有很大的帮助[17-18]。

本研究中的大部分预测模型的准确度还不够高,可能由很多方面的原因导致:(1) 功能连接特征仅仅是体现大脑功能的一个维度,更多的功能特征可以被结合起来进行年龄预测。(2) 个体差异性非常大,即同龄人在功能连接上有不同的特征模式,在现有的特征筛选方法中,个体差异的影响还没有得到体现,更有效的特征筛选方法可以得到更高的准确度。(3) 不同年龄段的样本量不均衡,导致样本量较小的年龄段不能得到足够训练,从而误差相对较大。(4) fMRI信号本身信噪比不高,有效的预处理可以挖掘出更可靠的神经活动信息。

4 结论

本研究证明了rs-fMRI可用于健康中老年人的年龄预测,能够获得较好的预测性能,并且大脑图谱的选择、全脑信号回归及性别分组对年龄预测的准确性都有影响。未来的研究可在特征挖掘方法及识别模型上进行深入开发,从而继续提高年龄预测的准确度。

猜你喜欢
全脑图谱年龄
变小的年龄
基于图对比注意力网络的知识图谱补全
全脑CT灌注成像诊断急性脑梗死的价值
全脑开发
SmartKey脑力空间组织的全脑开发体验课开课
图表
年龄歧视
算年龄
主动对接你思维的知识图谱
中国知名官方智库图谱