基于多变量符号转移熵的心电信号研究

2016-12-21 07:18王旭文
网络安全与数据管理 2016年23期
关键词:符号化正常人电信号

王旭文

(南京邮电大学 通信与信息工程学院,江苏 南京 210003)



基于多变量符号转移熵的心电信号研究

王旭文

(南京邮电大学 通信与信息工程学院,江苏 南京 210003)

复杂度理论已成为研究生理电信号的热点,而符号转移熵是一种反映系统混乱程度的非线性指标。文章在原有多变量转移熵的基础上提出了多变量符号转移熵,对传统时间序列静态划分方法做出了改进,即将时间序列使用动态自适应分割的方式进行符号化。应用该算法对正常人和冠心病患者的心电信号进行分析,在实验中选取最佳的导联对,结果表明该算法能够显著区分正常人和冠心病患者,对原始心电时间序列叠加上高斯噪声后依然可靠有效。

生理电信号;多变量符号转移熵;动态自适应分割

0 引言

人体最重要的生理信号就是电信号,电信号会随着时间的变化而产生瞬时的变化,这是因为人体的生理状态和病理状态是不同的。符号转移熵作为一个生理电信号特征,在生理电活动信号的特征提取与分析中发挥了越来越重要的作用[1]。

从临床医学方面来说,心电信号是心脏电活动体表的综合反映,因此,临床心电图检验对于检测和诊断心脏疾病有着十分重要的意义,并且对生命信息科学也有着十分重要的研究价值。

本文首先提出多变量符号转移熵算法,该算法主要用来分析心电信号的多变量符号转移熵值,采用自适应动态化方法划分时间序列[2]。然后通过正常人与冠心病患者的心电数据对比,传统算法与所提算法对比,以及叠加与不叠加高斯噪声对比,表明所提算法具有良好性能[3]。

1 多变量符号转移熵

1.1 多变量转移熵

1.2 原始序列符号化

符号动力学是研究符号动力系统的一种复杂抽象的数学理论。在符号动力学系统中,系统的状态可以表示成有限个抽象符号的无穷序列。

符号时间序列分析方法是指把原始的时间序列转化成由若干个符号组成的时间序列,然后进行分析的一种“粗略”方法[4]。在把原始时间序列符号化的进程中,时间序列会不可避免地失去一部分细节信息。尽管失去了一部分的细节信息,原始时间序列的动力学特征还是保存了下来。在计算中使用符号化后的符号序列来代替原始的时间序列,会极大地提高计算数值的速度。

对原始时间序列进行符号化分析的过程中,最关键的是采取什么样的方式来对原始时间序列的值划分相应的符号区域,然后把原始时间序列转化成符号序列,有些符号动力学分析方法首先采用静态范围来划分符号区域,然后再进行符号的转化。

1.3 改进的多变量符号转移熵

在过去的20年,许多传统的算法都可以用来估计时间序列的复杂性,如维度和Lyapunov指数等。这些算法虽然都能够正确地估计复杂性,但是它们通常都需要很长的数据集来统计结果,不便于在临床上研究和应用。

使用动态自适应的方法来划分原始时间序列能够更精确地捕捉时间序列中的动力学特征。动态自适应划分方法如下:

对于一个N点的时间序列u:u={u(i):1≤i≤N}。对于时间序列u(i),在时间序列中嵌入m维相空间:

X(i)=[u(i),u(i+L),…,u(i+(m-1)L)]

(1)

其中m是嵌入维数,L是时间延迟。当时间延迟L选取为1时,m维向量的个数是N-m+1。对于任意一个m维向量,基本尺度BS是通过m维向量相邻两点之间差值的均方根计算的:

(2)

(3)

图1 序列符号化示意图

改进的多变量符号转移熵是指原始时间序列使用动态自适应进行划分,然后对符号化后的序列,利用多变量符号转移熵进行分析[6]。

2 基于改进算法的心电信号分析

2.1 实验数据

使用从医院临床诊断中采集得到的正常人与冠心病患者的原始心电信号的时间序列。该库中记录了包括12个导联信号(Ⅰ,Ⅱ,Ⅲ,aVR,aVL,aVF,V1,V2,V3,V4,V5,V6)的多参数脑电数据,该信号的记录长度均大于1 min,采样周期为512 Hz。

从正常人的心电数据和冠心病患者的心电数据中分别随机选取20个人的心电数据。选用的数据是分别从正常人心电和冠心病患者心电数据中取aVL、aVF、I 3个导联信号,即在已知I的条件下,计算aVL→aVF的多变量符号转移熵(由实验证实,aVL、aVF、I导联具有较好的区分度,故选择aVL、aVF、I导联作为研究对象)。将这两组数据分别记为样本“正常”及样本“冠心”。

2.2 实验方法

首先读取各组原始数据中有效的心电时间序列,对原始心电数据进行符号化处理,然后对符号化后的时间序列计算其多变量符号转移熵值,对计算出来的结果使用SPSS统计分析软件进行显著性查验来验证该算法的有效性[7]。

2.3 实验结果与分析

从“正常”与“冠心”样本中对每个个体的脑电信号序列每隔一个周期取一个点,取出全部的心电时间序列。对已经取出的心电时间序列,取长度为L=160的原始心电时间序列来计算心电数据的多变量符号熵。

对每个时间原始序列作符号化处理,计算每组时间序列长度为160的多变量符号转移熵值,并把计算的每个个体中的各个多变量符号转移熵值取平均作为这个个体最终的符号转移熵值。最后对这20个正常人和20个冠心病患者的多变量符号转移熵值进行平均,得到转移熵值。结果如图2所示。

图2 不同导联组下多变量符号转移熵值比较

由图2知正常人和冠心病患者在不同的导联组下心电信号的多变量符号转移熵的结果比较(横轴坐标表示的含义是:1—Ⅲ-> aVR |I, 2—aVL ->aVF|I, 3—V1-> V2|I, 4—V3-> V4|I, 5—V5-> V6|I)。在5组导联信号中,计算正常人与冠心病患者心电信号的多变量符号转移熵中导联aVL和导联aVF在导联I条件下多变量符号转移熵值的差值最大,由此可见信号区分度最好,所以取aVL和aVF以及I导联组数据作为分析对象。

对正常人与冠心病患者的心电信号的多变量符号转移熵值进行基本研究后,根据平均值与方差绘制成图,如图3所示。

图3 正常人和冠心病患者多变量符号转移熵比较

使用SPSS统计分析软件对提出的算法的准确性及有效性进行进一步验证,将计算结果进行独立T检验分析[8]。结果如表1所示。

表1 正常人和冠心病患者改进多变量符号

转移熵显著性差异

Leven方差相等性检验均值相等的t检验F显著性tdfSig.(双侧)平均差假设方差相等1.6110.2123.163380.0034.5834假设方差不等3.16336.5600.0034.5834

由表1可知,t=3.163,Sig=0.003<0.05, 这说明正常人与冠心病患者心电信号的多变量符号转移熵的差异性非常显著,该算法可以有效地区分正常人与冠心病患者。

对样本“正常”和“冠心”的心电数据采用传统符号化计算的多变量符号转移熵和改进的多变量符号转移熵比较,分析对比结果如图4所示。

图4 传统与改进多变量符号转移熵值比较

图4表明无论是正常人还是冠心病患者,改进算法的熵值均大于传统算法的熵值,而且可以有效区分正常人和冠心病患者,说明改进的多变量符号转移熵在心电信号上优于传统的多变量符号转移熵。

对原始的心电时间序列叠加上高斯白噪声后[9],使用改进多变量符号转移熵算法计算正常人及冠心病患者心电信号的多变量符号转移熵值,与未叠加高斯噪声的多变量符号转移熵值对比,结果如图5所示。

图5 改进多变量符号转移熵算法健壮性分析

由图5可知,叠加上高斯白噪声后正常人及冠心病患者的多变量符号转移熵值并没有太大的变化,这说明改进的多变量符号转移熵算法稳健性高。

3 结论

本文提出的多变量符号转移熵算法,目的是为了计算电信号原始时间序列的多变量符号转移熵值,来区分正常人及患者。应用多变量符号转移熵在心电信号上,能实现预想的效果,对心电信号的研究及临床辅助诊断都有很大的帮助。

但是,该算法还有很多的不足和改进空间。一方面,多变量符号转移熵可以应用在更广泛的生理信号领域,比如脑电信号;另一方面,理论研究还需要与实际临床医学疾病的诊断和医治进行更为密切的结合,进一步提高算法和研究的实际应用价值及可操作性。

[1] 王俊. ECG 信号的非线性特性研究[D].南京:南京大学, 2005.

[2] WESSEL N, ZIEHMANN C, KURTHS J, et al. Short-term forecasting of life-threatening cardiac arrhythmias based on symbolic dynamics and finite-time growth rates[J]. Physical Review E Statistical Physics Plasmas Fluids & Related Interdisciplinary Topics, 2000, 61(1):733-741.

[3] 宋爱玲, 黄晓林, 司峻峰,等. 符号动力学在心率变异性分析中的参数选择[J]. 物理学报,2011,60(2):120-127.

[4] 曹雪虹,张宗橙.信息论与编码[M].北京:清华大学出版社,2004.

[5] 井晓茹.基于符号转移熵和平均能量耗散的睡眠分期分析[D].南京:南京邮电大学,2012.

[6] FERNANDO L D S.EEG and MEG:relevance to neuroscience[J]. Neuron, 2013, 80(5):1112-1128.

[7] FEIGE B, VODERHOLZER U, RIEMANN D, et al. Independent sleep EEG slow-wave and spindle band dynamics associated with 4 weeks of continuous application of short-half-life hypnotics in healthy subjects[J]. Scandinavian Journal of Public Health, 1999, 110(11):1965-1974.

[8] 陈志云, 袁华萍, 李敬红,等. 动态心电图学在现代诊疗中的进展[J]. 中国医学文摘:内科学, 2004(1):100-101.

[9] 陈天华, 韩力群, 郑彧. 心电信号噪声的数字滤波研究[J]. 微计算机信息, 2008,24(18):252-254.

王旭文(1992 -),女,硕士,主要研究方向:通信与信号处理。

Research on physiological signals based on multivariable symbols transition entropy

Wang Xuwen

(College of Communication & Information Engineering, Nanjing University of Posts & Telecommunications, Nanjing 210003, China)

Using complexity theory to study the physiological signals has become a hot spot.The symbolic transfer entropy is a nonlinear system indicator to reflect the degree of chaos, which can be used as a characteristic of physiological signals.The paper adopts multivariable symbols transition entropy based on the multivariable transfer entropy,to improve traditional time series static partition method using dynamic adaptive segmentation.Using this algorithm to analysis the ECG of people both normal and coronary heart disease patients. In the experiment by selecting the best lead pair to determine the improved algorithm can significantly distinguish between normal subjects and patients with coronary heart disease.And the original sequence is superimposed on the gauss noise result that the algorithm is still reliable and effective.

physiological signals ; multivariable symbols transition entropy;dynamic adaptive segmentation

TN911.23

A

10.19358/j.issn.1674- 7720.2016.23.017

王旭文. 基于多变量符号转移熵的心电信号研究[J].微型机与应用,2016,35(23):59-61,68.

2016-08-04)

猜你喜欢
符号化正常人电信号
小学数学教学中渗透“符号化”思想的实践研究
基于联合聚类分析的单通道腹部心电信号的胎心率提取
基于Code Composer Studio3.3完成对心电信号的去噪
基于随机森林的航天器电信号多分类识别方法
关于一阶逻辑命题符号化的思考
现代流行服饰文化视阈下的符号化消费
靠脸吃饭等
史上最强虐心考眼力
正常人视交叉前间隙的MRI形态特征
正常人大脑皮层言语分区结构性不对称研究