多分类器融合的移动用户行为识别模型

2016-06-29 12:00贺炎张航
科技视界 2016年16期

贺炎 张航

【摘 要】移动设备放置位置多样化以及不同用户行为的差异性,大大增加了用户行为识别的难度。为了提高移动用户行为识别的准确率,本文提出了一种多分类器融合的移动用户行为识别模型(BRMMCF)。该模型根据融合算法将多个基分类器的识别结果进行融合处理,得到行为识别的最终结果。该模型分别采用SVM和决策树作为分类算法,基于数据集XUPT-AAD进行了验证。实验结果表明,该模型对静止、步行、跑步、上楼、下楼的平均识别准确率达到95.05%。

【关键词】行为识别;基分类器;多分类器融合

0 引言

随着科技发展以及人们生活水平的提高,智能手机已经成为了日常生活的必需品。集成在智能手机内的加速度传感器,具有体积小、功耗低和灵敏度高等特点,为利用智能手机实现移动情景识别提供了必要条件。作为移动情景识别的一个重要研究方向,专家学者们就如何根据智能手机内部各种传感器采集的数据进行人体行为识别展开了广泛研究,越来越多的研究人员通过移动设备内嵌传感器来采集数据,并对原始数据进行预处理、特征选择、分类器训练,得到用户行为模型,运用该模型分析、确定未知用户的行为,并根据行为识别结果为用户提供所需要的各项服务。该技术在儿童和老年人安全监护、智能监测、生物医学、智能视频监控等方面具有极其广阔的应用前景。

1 已有研究

用户行为本身具有较大差异性,数据采集过程中移动设备放置位置多样化,以及采集环境多样化等因素,都将大大增加用户行为识别的难度。国内外研究者们在这一方面做了大量研究。Zhang等人[1]提出一种基于粗糙集理论的知识增益方法来选择特征,进而用于人体行为识别。赵海勇等人提出了一种以人的动作序列图像的轮廓为特征、基于隐条件随机场的行为识别方法,利用背景差分法和阴影消除技术提取运动人体轮廓[2]。谢立东提出了一种采用分层方法来研究人体行为识别技术的方法[3]。范琳等人提出了一种与穿戴位置无关的手机用户行为识别模型[4],对走路、跑步、上楼、下楼等日常行为识别的准确率最高达88.32%。王忠民等人提出了一种多频段时域分解的行为识别特征优选方法[5],对日常行为的识别准确率最高达89%。衡霞等人提出了一种依据手机内置三维加速度传感器采集的人体日常行为数据来进行识别分类的方法,平均识别正确率为87.17%。陈益强等人将智能手机放置位置细分为:右裤子口袋、右手、右上衣口袋、左裤子口袋、左手、左上衣口袋6种,从加速度数据中提取最大值、最小值、标准差、能量、均值等特征,采用ELM算法,建立手机放置位置交叉的自适应行为识别模型,对静止、下楼、走路、跑步、上楼进行识别,其平均识别准确率能提高12%左右。

为了进一步提高移动用户行为识别的准确率,本文提出了一种基于多分类器融合的行为识别模型。

2 行为识别模型

2.1 数据处理流程

本文根据内嵌在智能设备中的三轴加速度计实时采集人体日常行为加速度信号,从中提取出常用时域特征,生成特征数据集T后,划分为训练集X和测试集Y。根据训练集X训练出k个基分类器,并用测试集对各基分类器进行测试。测试结果经融合器处理后,得到最终的行为识别结果(图1)。

2.2 基分类器

基分类器的生成主要有神经网络、决策树、支持向量机、Bayes准则等方法,基分类器的性能对行为识别有重要影响。本文选用决策树算法和支持向量机来训练基分类器。

2.3 融合算法

集成学习的思路是在对未知的实例进行识别时,把若干个基分类器的行为识别结果通过某种规则进行融合,确定最终识别结果,以取得比单个分类器更好的识别效果。本文采用多数投票法作为融合算法(如图2所示),所构建的行为识别模型如图3所示。

3 实验设计及结果分析

3.1 实验环境及数据集

本文所用数据集是XUPT-ADD,是课题组成员使用内嵌三轴加速度计的智能手机实时采集的静止、行走、跑步、上楼、下楼等日常行为数据。数据采集时,智能手机分别放置在手中、包里以及裤子前口袋。参与此次数据采集的一共有15人,每人分别采集三种不同位置下每种行为的加速度数据,共1973个样本。从原始加速度数据中提取平均值、中位数、方差、标准差、最大值、最小值、范围、均方根、直流分量、系数和、频谱能量等特征值,生成特征数据集T。

行为识别模型训练和测试所用软件环境为MATLAB R2010b。

3.2 实验设计及结果分析

为了验证多分类器融合的行为识别模型的有效性,本文首先将特征数据集T划分为五组,训练出5个采用SVM算法的基分类器和5个采用决策树算法的基分类器,然后将各基分类器的测试结果和融合后的测试结果进行对比分析。

(1)数据集划分

将特征数据集T随机分为三个人一组,共五组数据,每组数据都包含了五种行为。训练基分类器时,根据以下方式将特征数据集再细分为训练集和测试集:第一种,是分别提取每组数据中每一种行为的前一半作为训练集,而剩下的一半作为测试集;第二种,是每组的全部数据作为训练集,第五组数据作为测试集;第三种,是取每组数据的奇数行作为训练集,偶数行作为测试集。

每种数据分组方式都将分别训练出5个采用SVM算法的基分类器(ClassifierS1~ClassifierS5)和5个采用决策树算法的基分类器(ClassifierD1~ClassifierD5)。

(2)基分类器与多分类器融合的行为识别结果分析

按照上述三种方式将特征数据集划分为不同的分组后,在 MATLAB中分别训练决策树和支持向量机的基分类器模型,并采用对应的测试集作为输入数据来测试基分类器。将上述基分类器的行为识别结果根据多数投票法进行融合处理,得到多分类器融合的行为识别结果。对上述识别结果进行比较,其识别准确率如表2所示。

表2中,从12个基分类器的行为识别结果来看,由于不同用户的行为差异较大,因此第二种数据分组方式中,分别采用其他组的数据(第五组除外)来训练基分类器而用第五组数据来测试时,不论是采用SVM还是决策树分类算法,行为识别的准确率都比较低。三种数据分组凡是相比,第三种分组方式的行为识别准确率较高。

总的来说,不论采用哪种数据分组方式,多分类器融合的行为识别模型结合了各个基分类器的优点,其行为识别准确率比单个基分类器的识别准确率高,在第三种数据分组方式中,行为识别准确率最高提高了25.99%。

4 结论

为了提高移动用户行为识别的准确率,本文提出了一种基于多分类器融合的行为识别模型。本文将特征数据集按照三种不同的方式分别划分为训练集和测试集,采用SVM算法和决策树算法分别训练基分类器,并对各基分类器和多分类器融合后的行为识别结果进行了对比分析。实验结果证明,多分类器融合的行为识别模型能够提高行为识别的准确率,最高达25.99%,充分验证了改模型的有效性。

【参考文献】

[1]Zhang B,De Natale F G B,Conci N.Recogition of social interactions based on feature selection from visual codebooks[C]//Image Processing,2013 20th IEEE International Conference on, 2013: 3557-3561.

[2]赵海勇,贾保先.基于轮廓特征的人体行为识别[J].计算机科学,2013,40(2):312-315.

[3]谢立东.基于分层方法的复杂人体行为识别研究[D].厦门:厦门大学,2014.

[4]范琳,王忠民.穿戴位置无关的手机用户行为识别模型[J].计算机应用研究, 2015,32(1):63-66.

[5]王忠民,王斌.多频段时域分解的行为识别特征优选[J].计算机应用研究, 2015,32.

[6]衡霞,王忠民.基于手机加速度传感器的人体行为识别[J].西安邮电大学学报,2014,19(6):76-79.

[7]CHEN Yiqiang, ZHAO Zhongtang, WANG Shuangquan and CHEN Zhenyu. Extreme Learning Machine based device displacement free activity recognition model[J]. Soft Computing. Volume 16, Issue 9: 1617-1625. Springer-verlag 2012.

[责任编辑:杨玉洁]