可穿戴传感步态模式深度学习融合判别模型①

2021-05-21 07:23谈巧玲吴建宁
计算机系统应用 2021年5期
关键词:模式识别步态卷积

谈巧玲,吴建宁

(福建师范大学 数学与信息学院,福州 350117)

近年来,基于户外环境获取步态数据构建泛化性能优越的机器学习步态分类模型在步态模式识别研究领域受到广泛关注,对于预防老年人跌倒、老年神经性功能疾病诊疗和康复评价、人体身份鉴别等具有重要意义,已成为目前步态模式识别相关研究领域一个新的研究探索热点[1,2].近年来,随着先进数据采集技术快速发展,一些先进的数据采集技术(诸如,计算机视频、无线雷达、可穿戴传感器等)相继被用来采集户外环境中步态模式数据.诸如,一些学者基于计算机视频采集的步态图像数据,探讨了不同视角环境下的户外人体步态模式识别相关研究[3];另外一些研究学者基于无线雷达装置获取的步态数据,探讨了蕴含微多普勒特征信息的户外环境步态模式识别研究[4];还有一些学者基于可穿戴传感器(加速度计、陀螺仪、磁力计等)的步态数据,探讨了户外环境下的步态模式识别研究[5].研究发现,便宜、便携的可穿戴传感器步态采集技术具有适应不同户外应用场景、蕴含较丰富步态特征信息量等优点,可较好避免计算机视频技术因户外环境、人体穿戴衣物遮挡丢失有价值步态特征信息、无线雷达装置因外界环境干扰丢失无线步态探测信号等局限,有助于提升步态模式识别效能,在近年来相关研究应用较为广泛.

基于可穿戴传感器数据应用机器学习算法探寻泛化性能优越的步态模式识别模型受到相关研究持续高度关注,其基本思想:能够充分利用机器学习算法优越的数据学习性能从可穿戴传感器步态数据中获得更具代表性的步态特征信息,提高步态模式识别性能.早期,一些研究探讨了基于传统机器学习算法(诸如,决策树、多层感知神经网络、支持向量机、K-近邻等)量化分析可穿戴传感器数据,尝试构建泛化性能优越的步态模式识别性能[6,7].诸如,Bao 等[8]探讨了基于三轴加速度计步态数据,构建ID3 决策树步态模式识别模型鉴别正常行走、慢跑、爬楼梯等3 种步态模式,平均识别率仅为79%.Tahafchi 等探讨了应用KNN 分类算法从帕金森受试者可穿戴传感数据(包含三轴加速度数据、陀螺仪数据、磁力计数据以及双通道的非侵入型的肌电扫描仪数据)中获取与帕金森冻结步态密切相关的步态特征信息,步态模式识别率根据参与者对象分别达到91.9%、87.1%、80.9%以及79.9%[9];此外,Nickel 等学者基于可穿戴传感器加速度步态数据,分别探讨了基于支持向量机、隐形马尔可夫模型、KNN 分类算法构建步态模式识别模型相关研究,其中支持向量机以及隐形马尔可夫模型的平均错误率(Equal Error Rate,EER)分别是10.00%和12.63%,KNN 分类算法的一半总错误率(Half Total Error Rate,HTER)可达到8.24%[10,11];研究发现,传统机器学习算法在处理可穿戴传感器步态数据识别步态模式中具有较低计算复杂度等优点,但因其内在线性计算模型架构难以获取隐含于可穿戴传感器步态数据内在结构中更具代表性的步态特征信息,难以支撑构建泛化性能优越的步态模式识别模型.近年来,随着深度学习等新兴机器学习理论的快速发展以及在图像处理等领域成功应用,一些学者尝试探讨基于可穿戴传感器步态数据构建深度学习步态模式识别模型,其基本思路旨在充分利用深度学习算法卓越的数据学习性能从高维可穿戴传感步态数据中获取更具代表性步态特征信息,提高步态模式识别性能.诸如,Zou 等[12]基于可穿戴智能手机采集的加速度数据和陀螺仪数据,探讨了构建卷积神经网络和循环神经网络相融合步态模式识别模型,尝试获取可穿戴传感步态数据内在时空相关性特征信息,提高步态模式识别性能,研究结果发现该方法在行人识别和身份认证中准确率分别高于93.5%和93.7%.此外,Ding 等[13]研究学者提出了一种基于可穿戴步态数据(在小腿上佩戴惯性测量单元收集角速度数据)的长短时记忆算法LSTM的步态模式识别模型,旨在通过长短时记忆算法获取隐含于可穿戴步态数据的时间相关性步态特征信息探测步态相位,并利用相位标记数据对其进行训练,实验结果表明识别准确率可达91.4%.近年来的基于深度学习的步态模式识别相关研究虽取得了较好的成果和积极进展,但仍缺乏准确获取隐含于可穿戴步态数据中更具代表性的时-空相关性步态特征信息的技术手段,严重制约着步态模式识别性能.相关医学研究表明,步态是人体行走的姿态,与人体神经系统、运动系统、心理认知系统等生理因素密切相关,是一个各生理因素相互作用、相互影响的长期记忆过程,而目前研究所采用自循环神经网络模型仅具短时记忆性能,难以获得步态过程中长期时间相关性特征信息.急需探索新的获取隐含于可穿戴步态数据中更具代表性的时-空相关性步态特征信息的深度学习模型.

为此,基于可穿戴传感器步态数据,本文提出一种将卷积神经网络模型和长短期记忆神经网络模型相融合的步态模式深度学习判别新模型,旨在充分利用卷积神经网络模型优越的获取数据局部空间最具代表性特征信息特性和长短期记忆神经网络模型优越的获取数据内在长期时间相关性特征信息特性,准确获取隐含于可穿戴步态数据中更具代表性的时-空相关性步态特征信息,提高步态模式识别性能.此外,本文选取公开的加州大学欧文分校UCI 数据库中的HAR 数据[14],并与传统机器学习算法、深度学习算法模型比较,验证本文所提模型算法有效性.

1 CNN-LSTM 深度融合学习步态模式判别模型

本文所提CNN-LSTM 深度融合学习模型旨在充分利用CNN、LSTM 模型分别获取数据结构内在空间、时间相关性特征信息的优异特性,将二者深度融合从可穿戴传感步态数据(诸如,加速度、陀螺仪等步态数据)获取更多蕴含与步态变化密切相关的时-空相关性特征信息,提高步态模式识别性能.也就是,假设需识别步态模式为数据集V={v1,v2,···,vl},其中,l表示待识别的步态模式数.假设可穿戴传感步态时间序列数据为:

为了准确识别步态模式,我们需构建一个模型Γ 从每一数据段hi中获取蕴含步态特征信息的向量Yi,也就是,Yi=Γ(D,hi)然后,基于一个推理方法Ψ 计算与每个步态模式vi相 对应的置信度值集P:P(vi/Yi,β)=Ψ(Yi,β),其中,β表示为一个基于模型Γ的训练参数集.那么,通过计算下列最大得分值:v*i=argmaxP(v/Yi,β),即可准确获得步态模式v*i,实现每个步态模式vi识别.研究中,我们构建CNN-LSTM 深度融合学习模型作为模型 Γ,首先采用CNN 深度学习模型从每一数据段hi中获取蕴含与步态模式变化密切相关的局部空间特征信息,在此基础上,基于LSTM 深度学习模型获取步态数据局部空间特征的时间相关性,获得更多与步态模式变化相关的时-空特征信息,最大概率获得到步态模式v*i,准确识别步态模式vi.

本文所提基于CNN-LSTM 融合深度学习步态模式判别模型框架如图1所示,由步态数据输入层、CNNLSTM 融合深度学习、全连接层3 部分组成.

图1 CNN-LSTM 网络框架

如图1,鉴于可穿戴步态传感数据的时-空相关特性,CNN 由3 个卷积层(CL1、CL2、CL3),一个池化层(MP1),两个dropout 层组成,准确获取步态数据内在最具代表性的局部空间特征;为准确获得步态数据内在最具代表性局部空间特征的时间相关性,LSTM模型由32 个cell 组成,为准确获得步态数据内在最具代表性局部空间特征的时间相关性,全连接层由6 个cell 组成,最大概率识别步态模式.

(1)基于CNN 提取步态数据内在最具代表性局部空间特征

为有效获取步态特征信息,可穿戴传感步态时间序列在t时刻的数据定义为:

其中,BA-XYZ 表示三维人体运动加速度数据,GAXYZ 表示三维重力加速度数据,Gy-XYZ 表示三轴陀螺仪数据.便于分析,选取t∈{1,···,128},其传感步态数据输入序列定义为:

假设用于获取最具代表性步态局部空间特征的CNN 模型共有L卷积层,每层卷积核定义为:Ml×Nl,第l∈{1,···,L}卷 积层提取步态局部空间特征F(l),其定义为:

其中,f(·)表示激活函数,〈·〉 表示内积,b(l)为偏置项;w(l)为一维卷积核向量;φ为w(l)的长度.

鉴于式(3)所定义的可穿戴传感步态数据所具高维性、非线性、随机性等特点和低算法复杂度,本文构建三层一维卷积层,每个卷积层均有32 个卷积核,其大小定义为3×3,步长定义为1,采用良好非线性特性ReLU 函数[15,16]作为激活函数.根据式(3),可穿戴传感步态输入数据大小定义为128×9,可分别获得第一层、第二层以及第三层卷积层输出的步态局部特征数据:126×32、124×32和122×32.为有效保持较好学习性能避免过拟合,构建一个Dropout 层.为有效保持卷积层所获得步态特征内在特性,降低其冗余性信息,利用池化层降低特征维数且增加其空间不变性[17],定义最大池化技术的池化层获取蕴含更多最具步态变化信息的局部空间特征Pj,定义为:

其中,R表示池化窗口大小.

为此,基于式(5)可从可穿戴传感步态时间序列数据中得到最具步态变化信息的局部空间特征,为后续获取其时间相关性特征奠定基础.我们将此局部步态特征作为LSTM的输入提取步态数据长时期的依赖特性.

(2)基于LSTM 层提取步态数据局部特征的时间相关性

一个步态活动可考虑为一个长序列的时间序列,通过建立自回归模型RNN 可有效提取局部特征的长期时间相关依赖特性.本文鉴于长短期记忆网络(LSTM)所具良好动态学习时间序列数据内在时间相关性的自回归网络架构特性[18],构建LSTM 单元cell,包括1 个记忆单元C和3 个门函数(输入it,遗忘ft,输出ot),实时提取步态数据的内在长期时间相关特性信息,具体实现如下.

假设用pt表示步态数据样本在t时刻通过CNN 模型处理过的一维特征图作为LSTM 神经元的输入项,经过LSTM的cell 时首先由遗忘门丢弃无用的提取数据信息,其输出为:

其中,σ表示激活函数Sigmoid,Wf为权值,bf表示偏置值.接着由输入门it和候选记忆单元C~t来确定更新的数据信息:

其中,Wi和Wc指的是权值,bi和bc指的是偏置值.之后由记忆单元Ct表示该LSTM的cell 更新状态:

最后确定LSTM 单元的输出数据信息ht为:

其中,ot是输出门;ht是当前神经元在时间的输出.具体的推导公式可参考文献[19].通过上述记忆单元Ct保留经历过遗忘和输入的信息实现了LSTM 单元有效传递时间间隔较远的历史信息从而获取数据内在时间相关性特征.本文所提LSTM 层由32 个cell 组成处理时序信号表示为一维特征向量如式(12)所示.

特征向量s进入由6 个cell 组成的全连接层处理,其输出为:

其中,W为全连接层的权值矩阵;ε是偏置项向量.我们将全连接层的激活函数设置为Softmax 函数,则最终输出为:

通过式(14)最大概率识别步态模式vi.

从上述分析可知,本文所提CNN-LSTM 模型充分融合CNN和LSTM 两者获取步态时间序列数据内在最具代表性的时间、空间步态特征的优异特性,降低其学习网络结构复杂性和模型较大训练开销,增强融合深度学习算法非线性拟合性能,有助于提升本文所提模型步态分类的精确度和准确度.

本文所提神经网络模型采用分类交叉熵损失函数最小化训练样本的分类错误率,其定义为:

其中,D表示训练集,W表示权值矩阵,B表示偏置值;N表示训练样本的数量,y(i)表示的是第i个样本的标签,表示预测的标签以及〈·〉表示内积.

2 实验与结果分析

2.1 实验数据获取

本文采用的是加州大学欧文分校(University of California Irvine)提出的用于机器学习的UCI 数据库中的HAR 数据集.该数据集收集了30 名年龄在19至48 岁的志愿者的6 种步态模式:站立、坐着、躺下、行走、在楼上和楼下行走.每个受试者执行两次实验方案:第一次实验将智能手机(内置加速度计和陀螺仪)佩戴于腰部左侧;第二次实验,受验者随意放置智能手机.要求受验者在实验室环境下以自己舒适的步速完成不同步态行走,便于获得较真实行走步态数据集.采样频率设置为50 Hz 采集三轴加速度和角速度步态行走数据.

2.2 数据预处理

为有效消除噪声干扰获取蕴含更多有用步态数据,本文采用中值滤波器和三阶低通Butter-worth 滤波器(截止频率设置为0.3 Hz)对人体加速度信号和重力加速度信号消噪处理.设置窗口宽度为2.56 s 进行滑窗采用数据,窗口重叠设置为50%,即每个窗口有:2.56 s×50 Hz=128 周期,采用快速傅里叶变换获取17 个步态数据时域、频域步态特征.为此,文中采用了17 个度量标准评估时域和频域的特征向量,即总共提取了561 个特征来描述每个活动窗口(样本点),每个样本点看作为一种步态模式,其度量标准如表1所示.

表1 计算特征向量的度量表

2.3 步态分类性能评价标准选取

为客观、准确评价本文所提步态分类模型的泛化性能,本研究选取步态分类相关研究常用的分类准确率、步态精确率、召回率作为步态分类性能客观评价指标.

(1)准确率(Accuracy):用于客观评价本文所提步态深度学习分类模型的精确度,其定义为:

其中,TP表示正确识别步态模式的样本数;FP表示错误识别步态模式的样本数;TN表示正确步态模式错误识别为其他步态模式的样本数;FN表示步态模式错误识别为正确步态模式的样本数.

(2)步态精确率(Precision):用于客观评价本文所提步态深度学习分类模型“真正”鉴别步态模式的性能,其定义为

(3)召回率(Recall):用于客观评价本文所提步态深度学习分类模型步态模式正确识别的性能,其定义为

2.4 实验结果

本文实验是基于谷歌开源的深度学习框架Tensorflow 实现,具体的实验平台为CPU(i5),Python3.7,Keras2.3,Tensorflow2.1.选取样本数10 299,随机选取70%为训练集、30%为测试集,实验数据分批送入模型训练,批处理块大小为32 个数据样本.模型的训练回合数设置为30 且采用了自适应学习率优化算法Adam且学习率设置为0.001.

(1)步态深度学习分类模型最优结构参数选取

为准确优化设计本文所提步态深度学习分类模型结构,提高其性能,本文首先量化评估所提模型优化选取卷积神经网络部分的卷积层数和长短期记忆网络中神经元数量.卷积神经网络卷积层数选取结果如图2所示,从图2可以看到,当卷积层数从1 增长到3 时,模型的准确率逐步增大,当卷积层数为3 时,分类准确率最大,可达92.1%,但卷积层数增至4和5 时,分类准确率显著下降,结果表明,当卷积层数为3 时,本文所提步态融合深度学习分类模型可从可穿戴传感加速度和陀螺仪步态数据中获得蕴含更多与步态模式变化密切相关的步态特征信息,有效提升模型的分类性能,而卷积层数增至4和5 时,难以从可穿戴传感步态数据中获得一些代表性特征信息,可能丢失一些有用步态特征信息,降低模型的分类性能.

选取最优LSTM 模型的神经元数的结果如图3所示,从图3可以看到,当神经元数从16 增至256 过程中,选取不同神经元数影响模型步态模式分类性能.当神经元数为32 时,分类准确率最大,可达92.3%,当神经元数从32 增至256 时,分类准确率显著下降.结果表明,神经元数选取32 时,本文所提模型可从可穿戴传感步态数据空间局部特征获得更多与步态变化密切相关的时间相关特征信息,显著提升本文所提模型步态分类性能.

图2 卷积层数对分类准确率的影响

图3 LSTM 神经元数量对分类准确率的影响

(2)CNN-LSTM 模型步态分类性能评估结果

本文所提CNN-LSTM 步态深度融合学习模型基于所取最优参数的分类性能评价结果如表2所示,从表2可以看到,本文所提模型能以较好分类性能鉴别6 种不同步态模式,平均准确率可达91.45%、平均召回率可达91.53%;比较而言,“躺”步态模式具有最高准确率,可达99%,表明本文所提深度融合学习模型能够有效从可穿戴传感加速度、陀螺仪步态数据获取与“躺”步态模式密切相关的时-空步态特征信息,有效提高其模式鉴别性能.然而,“站立”步态模式准确率最低,仅为80.94%,“坐”步态模式召回率最低,仅为81.06%,这些结果表明,本文所提模型难以从可穿戴传感加速度、陀螺仪步态数据获取与“坐”、“站立”步态模式密切相关的时-空步态相关特征信息,这可能由于本文所取步态数据采集过程可穿戴单传感步态采集器佩戴人体解剖部位难以捕获“坐、站立”步态模式相关信息.

另外,基于相同的步态数据,本文选取基于传统机器学习算法(诸如决策树、KNN、支持向量机等)构建的步态分类模型,进一步评价本文所提模型的优越性能,其比较分类性能如表3所示,从表3可以看到,本文所提步态深度融合学习模型的准确率、精确率、召回率最高,均可达91.5%;其次,KNN 步态分类模型准确率、精确率、召回率均约为90%;支持向量机准确率、精确率、召回率均低于90%,而决策树步态分类模型准确率、精确率、召回率最低,仅为86%,上述结果表明,本文所提CNN-LSTM 步态深度融合学习模型分类性能明显优于传统机器学习步态分类模型性能,其根本原因在于本文所提模型能够充分利用CNN、LSTM 深度融合学习算法所具获取数据最具代表性特征的优异特性,有效从可穿戴传感加速度、陀螺仪步态数据获取最具代表性的时-空相关性步态特征,显著提升步态分类性能,而传统机器学习步态分类模型基于线性模型仅可获取局部空间、时间步态特征,难以从可穿戴传感加速度、陀螺仪时序步态数据获取最具代表性的时-空相关性步态特征,影响其分类性能.

表2 6 种步态模式分类结果

表3 与传统机器学习算法步态分类比较结果(%)

此外,为进一步评价本文所提模型的有效性,基于上述相同步态数据,将本文所提模型与其他传统深度学习模型(诸如CNN、RNN[20]、LSTM、GRU[21]等模型)进行比较,其比较结果如表4所示.从表4可以看出,本文所提CNN-LSTM 模型步态分类性能明显优于其他传统深度学习步态分类性能.就比较而言,RNN网络模型步态分类性能较差,其准确率、精确率、召回率仅均约为70%,其原因在于RNN 网络学习模型难以获取步态时间序列内在最具空间、时间相关性步态特征信息;CNN、GRU和LSTM 三个学习模型的准确率、精确率、召回率均约为88%,其步态分类性能虽优于RNN 网络学习模型步态分类性能,但明显低于本文所提CNN-LSTM 融合学习模型的步态分类性能,其根本原因在于:基于传统CNN 深度学习的步态分类模型仅能获取步态时间序列数据内在最具代表性的局部空间步态特征信息;基于传统LSTM、GRU 深度学习的步态分类模型仅能获取可穿戴步态时间序列数据内在最具代表性的时间相关性步态特征信息,上述两种传统深度学习步态分类模型局限在于难以获取可穿戴步态时间序列数据内在最具代表性的时间-空间相关性步态特征信息,而本文所提CNN-LSTM 融合深度学习步态分类模型可充分融合CNN、LSTM 各具获取步态时间序列内在空间、时间相关性特征信息优异特性,有效获取可穿戴步态时间序列数据内在最具代表性的时间-空间相关性步态特征信息,弥补传统CNN、LSTM深度学习模型获取步态时间序列数据内在最具代表性步态特征信息的局限,有效提升基于可穿戴步态传感数据的步态分类性能.

表4 与同类深度学习算法步态分类比较结果(%)

3 结论

本文提出了一种基于可穿戴传感数据的步态模式深度学习融合判别新模型,该模型能够充分融合卷积神经网络和长短时记忆神经网络深度学习模型所具获取数据最具时空代表性特征的优异特性,有效从可穿戴传感加速度、陀螺仪步态数据获取最具代表性的时-空相关性步态特征,显著提升可穿戴步态模式分类性能,为进一步深入开展可穿戴多传感步态模式深度学习分类相关研究提供可靠借鉴.

猜你喜欢
模式识别步态卷积
基于步态参数分析的老年跌倒人群步态特征研究
基于全卷积神经网络的猪背膘厚快速准确测定
轻身调脂消渴片的指纹图谱建立、化学模式识别及含量测定
特别策划《步态分析研究综述》
I、II类单点故障模式识别与质量管控浅析
基于图像处理与卷积神经网络的零件识别
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
步态识人
汽车外观造型创新设计遗传算法的应用