基于改进区域生长法的汉字骨架提取算法

2021-09-22 02:14刘南锋
科技研究 2021年22期
关键词:细化

刘南锋

摘要:針对Zhang-Suen细化算法细化汉字时存在交叉点易出现断裂、汉字骨架有毛刺和无法保证单一像素的问题,提出一种基于改进区域生长法的汉字骨架提取算法。首先,该算法对二值图像汉字按笔画进行分解;然后对分解后的每个汉字笔画基于改进区域生长算法采用设计的区域生长规则对笔画进行细化,并基于笔画宽度与细化后笔画宽度比例关系确定细化笔画位置;最后对细化后笔画按照笔画顺序合并得到细化后的文字骨架,消除Zhang-Suen算法弊端并提高细化后文字骨骼线的质量。

关键词:Zhang-Suen细化;区域生长法;汉字笔画;细化;汉字骨架

中图分类号:TP391 文献标识码:A

0引言

随着计算机视觉领域的不断发展,运动目标检测、人脸识别、指纹识别以及字符处理等领域得到广泛应用,而目标特征的提取将是计算机视觉处理的关键步骤[1]。在字符处理领域,对汉字进行细化得到汉字骨架将是目标特征提取的重要手段,汉字细化一般是指在保证原汉字拓扑结构的情况下,删除汉字周边像素直至得到位于中心线的单像素汉字骨架,但汉字骨架的提取受细化算法规则的制约,易出现笔画断裂、像素冗余和汉字骨架存在毛刺等问题,影响汉字细化结果质量。因此,在保证汉字原始拓扑结构不变的情况下,对汉字进行细化来提取定位更精确的汉字骨架将成为字符处理领域研究的热点问题[2]。

为适应技术发展的需求,国内外学者提出很多经典细化算法,包括:Hilditch细化算法[3]、Pavlidis细化算法、Zhang并行细化算法、Zhang-Suen细化算法等。

1 算法分析

1.1区域生长算法

区域生长算法是区域分割领域经典算法,该算法对每个区域指定种子作为当前区域的生长点,然后将种子点和周围的像素点根据生长规则对比分析,并将符合条件的点放在一个集合继续生长,直至没有满足生长规则的像素点,该算法可将具有不同特征的连通区域进行分割,并得到较精确的边界信息和分割结果。其算法步骤为:

(1)首先算法需创建一个空白图像,并指定一个种子点进行生长,该种子点放入栈中。

(2)将当前种子点和周围像素点按照生长规则进行对比分析,并将符合生长规则的点压栈,并在下次将该点作为种子点按照生长规则继续生长。

(3)重复上述步骤,直到当栈中不存在种子点后停止生长,完成生长过程。

不难看出该算法是一种迭代算法,具有很好的分割效果,本文将引用区域生长算法并对区域生长算法进行改进,用于对汉字进行细化提取汉字骨架。

2 基于改进区域生长算法的汉字骨架提取

针对区域生长算法在对图像进行处理时获得精确的边界信息和较好分割结果的优良特性,本文将对区域生长算法进行改进来获得质量更佳的汉字骨架。其实现步骤如下:

(1)算法首先对汉字按照笔画顺序进行分解,来获得汉字的全部分解笔画。针对每个笔画,在笔画任意位置选择种子点,并将种子点sp1压入栈S中。

(2)根据设计的生长规则统计种子点周围八邻域像素点的个数,并根据八邻域像素点个数判定当前点是否可压入栈S中,具体生长规则如式(1):

式中,Num(sp1)表示当前种子点sp1八邻域像素点的个数;(1,2)表示像素点个数为1或2;Grow表示当前点为种子点并压入栈S中,同时以该点为生长点继续按生长规则生长;Del表示当前点为非种子点,删除该像素点。

(3)重复步骤(2)直到汉字所有笔画都经过细化,得到所有笔画的细化骨架。根据笔画宽度和细化笔画宽度比例关系[8],将得到细化笔画相对于原笔画的位置,即细化笔画置于原笔画的中心线位置。

(4)对笔画按照汉字分解的顺序进行合并,最终得到细化后的汉字骨架,完成汉字的细化。

3实验结果分析

3.1实验参数与评价指标

为验证本文算法的有效性,在硬件配置为:Inter(R) Core(TM) i7-10510U,主频为2.3GHz,内存为16GB;软件配置为:Microsoft Visual Studio 2010和OPENCV2.4.10的实验平台进行实验仿真。

3.2 实验结果分析

本文基于改进区域生长法的汉字细化算法相较于Hilditch细化算法和Pavlidis细化算法,可保证细化后的文字骨架相对于原文字图像拓扑结构不变,即保证汉字的原有特征不变,并很好的保持汉字T行交叉和拐点的连通性,克服畸变产生的影响。本文算法相较于Zhang并行细化算法和Zhang-Suen细化算法,可消除对汉字细化后出现冗余像素或像素骨架像素不单一的问题,同时本文算法可很好提取骨架的中心线结构,规避骨架毛刺的风险。综上,本文基于改进区域生长算法的汉字骨架提取算法在保证汉字原有拓扑结构的基础上可更精确的提取汉字的骨架,提高细化后汉字骨架的质量。

4 结论

本文提出一种基于改进区域生长法的汉字骨架提取算法。该算法首先对汉字按笔画顺序进行分解,得到该汉字的所有笔画集合;然后,基于区域生长法的思想对每个笔画选定种子点并按照设计的生长规则确定种子点继续生长,并对删除不满足生长规则的像素点;最后,基于笔画宽度和细化笔画宽度比例关系,确定细化笔画的中心线位置,并将所有笔画按笔画顺序合并得到最终细化后文字骨架。本文算法可很好克服现有细化算法的不足,并获得定位精度更高、质量更佳的汉字骨架。

参考文献:

[1]耿艺宁,刘帅师,刘泰廷,严文阳,廉宇峰.基于计算机视觉的行人检测技术综述[J].计算机应用,2021,41(S1):43-50.

[2]董军,蒋同海,艾孜麦提·艾尼瓦尔,程力,徐春.一种改进的哈萨克文编码字符处理方法[J].中文信息学报,2017,31(04):94-99.

[3]韩东旭,钟宝江.基于梯度掩模滤波的边缘细化算法[J].激光与光电子学进展,2020,57(18):182-188.

猜你喜欢
细化
在融入乡村振兴中细化文明实践
浅析人造板企业如何细化成本管理提升经济效益
道路保洁“以克论净”精细化管理的实践和思考
浅谈新教材下地理课堂教学的细化和补充
论初中英语教研工作中的“细”与“实”
点阵汉字细化算法及应用
用于提出负面评价的CA非优先结构的执行策略
活化教学目标,促进有效学习
基于分区梯度的医学图像边缘检测算法
细化定格,筛选凸显