基于深度学习的笔迹性别识别

2017-07-15 15:16刘维达卜巍邬向前
智能计算机与应用 2017年3期
关键词:笔迹深度学习

刘维达+卜巍+邬向前

摘要:笔迹性别识别在取证分析中具有重要意义。近年来,虽然笔迹性别识别获得了越来越多的关注,但是目前提出的算法都基于人工设计的特征,难以准确地表达笔迹包含的信息,因而准确率较低。针对这个问题,本文提出了一种基于深度学习的笔迹性别识别方法,使用深度学习caffe工具,将预处理后的笔迹图像输人本文设计的卷积神经网络进行分类。本文首先提取笔迹图像的每个单词,然后取单词的不同全排列拼接成基础图,接着按照固定的大小从基础图截取材料图,最后以材料图为输入数据,以包含7个卷积层的网络为模型进行分类。本文的方法在IAM On-Line公开数据库上进行了测试,取得了较高的识别率。

关键词:笔迹;性别识别;深度学习

0引言

近年来,由于在数据挖掘、取证分析、文档授权和判断真实历史笔迹等方面的应用,笔迹分析变得愈加重要。人类学习写字从模仿他人开始并逐渐形成自己的笔迹风格,在这个过程中,性别的影响是不容忽视的。Beech和Mackintosh研究了激素和笔迹风格的关系,由此发现产前激素对女性的笔迹风格有很大的影响。Mergl和Tigges的研究表明男性笔迹和女性笔迹存在明显差异,女性的笔迹更加易读,更加整洁和有组织性,而男性笔迹更加潦草,会出现更多的错误。

目前笔迹性别识别的方法有:基于梯度的识别算法GLBP,提取图像的HOG特征并结合根据LBP算子提取的梯度特征来支持处理识别,使用SVM进行分类,获得了75.45%的准确率:基于局部特征的识别算法,设计块特征计算密度并提取多种LBP特征和HOG特征加入研发识别,使用SVM进行分类,获得了70%的准确率;基于GMM的识别算法,将局部特征和全局特征融合进行分类,获得了67.57%的准确率。虽然现有的方法可以在一定程度上识别作者性别,但是由于这些特征表达的笔迹信息不准确,识别率一直并不理想。而深度神經网络能够自主学习特征,并且在人脸识别、物体的检测识别系统方面取得了堪称优良的效果,因此本文研发设计了一个深度适中的网络对笔迹进行性别分类。

1图像预处理

IAM On-Line数据库提供了笔迹图像按行分割的结果,图1为一幅笔迹图像按行分割的8幅图像。训练神经网络需要大量的数据,而IAM中的笔迹图像不到两万幅,直接使用数据库中的图像显然不能满足要求,所以本文将这些图像经过一系列处理,生成了大量图像。

猜你喜欢
笔迹深度学习
巧克力能否去除桌上的油性笔笔迹
来自未来的信
有体验的学习才是有意义的学习
电子商务中基于深度学习的虚假交易识别研究
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
深度学习算法应用于岩石图像处理的可行性研究
基于深度卷积网络的人脸年龄分析算法与实现
阅读理解填词训练
独一无二的笔迹