airPLS算法去除拉曼光谱背景噪声的有效性研究

2021-05-19 01:42郑成霞
电子元器件与信息技术 2021年2期
关键词:背景噪声成份曼光谱

郑成霞

(新疆昌吉职业技术学院 机电工程分院,新疆 昌吉 831100)

0 引言

拉曼光谱被称为物质的指纹光谱。因为,拉曼光谱是由物质的分子振动产生的非弹性散射光谱,物质决定了光谱频率的唯一性。物质的浓度与光谱强度息息相关。已有研究利用拉曼光谱的这些特性,来对物质做定性与定量分析。当生物组织发生病变时,一定会导致病变部分组织的生化成分或含量的变化,甚至是在发病前期,病变组织在物理形状上并未发生改变,但是其内部生化成分或其含量已发生轻微改变。此时,传统的医学检测技术很难检测出疾病的发生,并且传统的医疗检测技术多依赖于操作医师的经验与知识技能水平,从而不容易检测出早期疾病,耽误早期治疗导致严重后果。拉曼光谱是一种极其敏感的光谱,能够在分子水平上探测到被测样本的微弱变化,并且具有客观性、无创伤性、快速性等优点。因此,拉曼光谱已成为医学疾病诊断研究的热点与发展方向[1]。

拉曼光谱的背景噪声主要来自于被测样本的自发荧光。荧光会降低后续光谱分析结果的可靠性。因此,需要扣除拉曼光谱中的荧光背景。在自动扣除拉曼光谱中荧光背景的算法中,自适应迭代重加权惩 罚最小二乘法(airPLS),是一种精度较高的方法,也被用于基于拉曼光谱的宫颈癌诊断研究中去除拉曼光谱中的荧光背景[2]。在医学诊断中,诊断的精确性十分重要,若扣除背景时部分有用信息也被扣除,则诊断正确性必然会降低。目前还没有文献报道关于airPLS扣除生物组织样本拉曼光谱中荧光背景的有效性研究。因此,本文将对airPLS扣除宫颈癌组织拉曼光谱中的荧光背景的有效性展开研究。

1 算法理论

airPLS通过自适应的迭代过程不断的自行调整加权值,最终拟合出与实际背景有较高契合背景的背景拟合算法。airPLS算法应用于拉曼光谱背景扣除中,具有运算速度快,精度高的特点[7-8]。用于医学诊断研究的拉曼光谱通常都具有较高的数据维数,因此,扣除背景所需的时间也较长。airPLS算法在扣除高维拉曼光谱中荧光背景时,所需时间随数据维度增长线性增加。因此,airPLS算法即使被用于去除高维光谱中的荧光背景时,任然具备处理时间快的优势[3-6]。

2 拉曼光谱

2.1 光谱数据

论文共使用了10条宫颈癌症组织拉曼光谱数据(腺癌与鳞癌光谱各5条)。

2.2 拉曼光谱数据处理

采用airPLS算法,扣除原始拉曼光谱中的荧光背景。

3 结果与讨论

图1 扣除背景前后光谱对比图

图1中虚线是原始拉曼光谱的曲线图,10条原始光谱曲线的基线各不相同,差异较大,背景噪声是产生基线差异的原因。为了提升后期数据分析的正确性,去除背景噪声十分有必要。图1中实线是扣除背景后的光谱曲线图。可以看出,扣除背景后的拉曼光谱曲线的基线已基本一致了。从图1中,可以直观的观察到airPLS算法的背景扣除效果是较好的,但是却无法观察出,airPLS算法在扣除拉曼光谱中的背景的同时,是否保留了拉曼光谱中的有用信息。为了验证airPLS算法是否能够有效的扣除宫颈癌组织拉曼光谱中的荧光背景,将采用主成份分析法(PCA)来进一步验证airPLS算法是否扣除了宫颈癌组织拉曼光谱中的荧光背景,采用PCA及微分法来验证airPLS算法在扣除荧光背景的同时是否完整保留了拉曼光谱中的有用信息。

3.1 airPLS算法扣除宫颈癌组织拉曼光谱中荧光背景效果验证

采用PCA验证airPLS算法是否能够切实的去除宫颈癌组织拉曼光谱中的背景成分。对经airPLS算法扣除背景前后的各10条光谱做相同的PCA处理,并以散点图的形式绘制出20条光谱在1,2主成份空间的分布情况。绘图时,采用颜色结合形状来区分扣除背景前后的两类光谱,未扣除背景的原始光谱用紫色三角形表示,扣除背景后的光谱用橙色菱形表示,如图2所示。

图2 扣除背景前后,光谱在第1,2 主成份空间的分布散点图

观察图2,容易发现三角分布分散,位置差异大,这是由荧光背景对光谱的影响导致的。菱形分布集中,相互之间位置差异较小。可看出,荧光背景的影响基本被去除。由对图2的观察可知,airPLS算法较好的扣除了宫颈癌组织拉曼光谱中的背景成分。

3.2 airPLS算法扣除宫颈癌组织拉曼光谱中荧光背景的同时保留光谱中有用信息效果验证

拉曼光谱中的荧光背景包络,是变化缓慢的曲线,因此可以被微分法去除。采用相同的微分法处理10条原始光谱以及10条经airPLS算法扣除背景的光谱。然后,采用PCA,对微分后的20条光谱做同样的主成份分析。基于得分越高的主成份所包含的信息量越大的原理,取前4个主成份得分,来绘制20条光谱在主成份空间的二维分布散点图,共绘制出12幅图,如图3所示。

图3 微分处理后20 条光谱的主成份空间二维分布散点图

绘图时,将光谱进行编号,微分处理后的10条原始光谱与微分处理后的经airPLS算法扣除背景的10条光谱,一一对应地均编为1-10号。图3中,采用不同形状的图形来区分不同编号的光谱。编号与形状之间的对应关系为:1号:,2号:,3号:,4号:,5号:,6号:,7号:,8号:,9号:,10号:。由于,相同编号的光谱有两条,则在图3中,每种形状的图形都应该出现2次。观察图3,发现在12个主成份空间分布散点图中,10种不同形状的图形,几乎都只能观察到一个,这说明,相同形状的两个图形重叠在了一起。这一结果表明,airPLS算法能够在去除宫颈癌拉曼光谱背景的同时,保留其中的有用信息。

至此,airPLS算法扣除宫颈癌组织拉曼光谱荧光背景的效果,以及保留光谱中有用信息的效果都得到了验证,即airPLS算法能够有效的扣除宫颈癌组织拉曼光谱中的荧光背景。

4 结语

本文将airPLS算法用于扣除宫颈癌组织拉曼光谱中的荧光背景,并从算法扣除背景的效果,保留光谱中有用信息的效果两方面,对airPLS算法扣除宫颈癌组织拉曼光谱中荧光背景的有效性进行了研究。研究结果表明,airPLS算法能够有效的扣除宫颈癌组织拉曼光谱中的荧光背景。

猜你喜欢
背景噪声成份曼光谱
环境背景噪声对飞机噪声监测结果的影响
绩优指数成份变更与一周表现
两市主要成份指数中期成份股调整
Variational Mode Decomposition for Rotating Machinery Condition Monitoring Using Vibration Signals
基于拉曼光谱的面团冻结过程中水分分布的在线监测
应用背景噪声成像研究祁连山地区地壳S波速度结构
海上单道地震勘探中船舶等背景噪声的影响分析及压制
欧盟禁止在化妆品成份中使用3-亚苄基樟脑
探测非透明介质下深层成分的拉曼光谱技术研究
青藏高原东北缘背景噪声特征分析