电力设备铭牌照片识别器

2019-02-14 06:02刘庆李义李鸿杰陈茜
中国科技纵横 2019年23期

刘庆 李义 李鸿杰 陈茜

摘 要:电力设备铭牌图片中,其文字的排版格式不一、字体格式复杂多样,在电脑端OCR文字识别软件基础上,研究出一种自然环境里中文文本的检测与识别,并开发具有该相关功能的软件,应用在电脑端实现OCR的应用场景。

关键词:电力设备铭牌;文字识别;OCR

中图分类号:TM63 文献标识码:A 文章编号:1671-2064(2019)23-0131-01

1 问题

目前电力系统中运行的各类设备,其设备铭牌上提供了设备的品牌、厂家、型号、产品名称以及各类电力参数信息,在电力生产过程中,电力公司需要熟悉这些技术参数,便于了解设备的性能,记录设备的技术参数存档。同时在维护过程中,需要通过这些信息,让设备厂家的客服能迅速了解设备可能的问题。由于各种电力设备的生产厂家生产的设备铭牌,其风格差异很大,采用现有的OCR识别系统,无法满足实际工作中众多电力设备铭牌的识别需求。

2 背景综述

目前电力系统运行中的设备铭牌照片采集时,通过手机或者相机采集的照片很不规范、且铭牌照片收集后,需要花费大量的人工进行照片上设备参数的识别,特别费时费力,且因各种原因,人工识别照片上的数字时经常会存在疏忽,造成部分设备参数不准确。通过电力设备铭牌照片识别技术的应用,可以规范快速安全采集铭牌照片,完成在自然环境里中文文本的检测与识别,收集到设备的电气参数信息。

OCR的识别过程,分为以下几步:图像获取、图像的预处理、特征提取、文字的识别、版面恢复、后期处理以及校对等功能组成。

(1)首先需要将图像进行载入,目前常见的图像格式有JPEG、PNG、PDF、IMG等图像格式,不同的图像格式分别有不同的存储格式、以及不同的压缩方式。

(2)图像的预处理主要包括灰度化、二值化、去燥、倾斜度调整、字符切割等。第一步是图像二值化采用阈值分割技术,擅长处理物体与背景具有强烈对比度的图像分割。可以把通过相机拍摄的铭牌图像简单地划分为前景与背景区域,对划分区域的彩色图像进行灰度化处理,在图像灰度化处理之后只含有前景色和背景色,通常情况下前景信息用黑色表示,背景信息用白色表示。第二步是去燥,所谓去燥就是对图像进行噪声去除,对图像文件上定义噪声特征,然后根据这个特征完成去燥处理。第三步是图像倾斜度的调整,就是在实际的拍照环节中,人们往往很难做到图像的完全水平垂直,使得拍摄的结果图像会出现一定的倾斜,为了让计算机更好的识别图像上的文字信息,需要对倾斜的图像进行水平或垂直调整,最后得到一个水平垂直的图像结果。

(3)特征提取,该步骤是希望找出图像中候选的文字区域特征,将图片划分N个段落,改过程就是版面分析,但实际图片的复杂性和多样性,因此不会有一个固定不变的最优分割模型。

(4)文字识别,字符识别方法特征提取方法为主。主要分为两类:一类为模式识别,向OCR程序喂送各种格式的字符用来识别、对比文档中的字符。另一类为特征检测,OCR程序使用一套规则来识别电子文档中字符和数字的特征。这些特征包括斜线、交叉线或曲线的数量等。例如,大写字母\“A”\可以存储为两条对角线中间与水平线相接。

(5)版面的恢复,就是在对识别出来的文字,按照原有图像文档的先后顺序,保持其原有上下左右的段落位置不变,按顺序的输出为可编辑的文字内容,可导出为pdf、word等格式文档。

(6)后期处理及校对,对于得到的文字内容,根据其特定的语言及上下文关系,对结果进行最后的校正,得到最终的可编辑的文字内容。

OCR程序有不同的算法来实现,但总的来说都是基于字符、词语或文本块来识别。当字符识别成功后,会被转换成ASCII码,用来作进一步处理。用户可以存储为电子文档,识别并纠正文字或复杂格式方面的错误。计算机视觉技术让计算机程序或者叫机器人能够看懂图像,并能够识别出图像中的元素,而不是靠人工配置的选择器识别图像。计算机视觉技术是一种算法,这种算法通过混合使用人工智能、OCR、文字模糊匹配和锚定系统,实现类似人类的图像识别能力。

OCR技术提供一种可靠的技术手段,实现了电子图片上文字信息进行数字化的转换,对特定格式图片内容进行算法识别,让OCR在日常的生活和工作中进行了众多的应用。

对于电力设备铭牌印刷形式的多样性,本研究项目提出根据设备铭牌图片实际情况,自动对图片中文字进行识别,并以可编辑的自由文本输出识别结果,以解决在自然环境里无特定样式的图片中文字识别,提高OCR技术在实际自然场景下的应用能力。

3 方案设计

电力设备铭牌上的信息,包含厂家的品牌、产品型号、生产日期、产品名称、设备电气参数等信息。在进行识别时,需要自动选定识别区域,通过各个识别区域的自动识别,获取设备铭牌上的文字内容。

选择电力设备的图像并输入后,经过一系列的加工和处理,包括文字方向校正等,使得文字基本能达到水平位置,得到一张可用于识别的图像。系统自动选择可识别区域,如图1所示。

然后依次进行各个识别区域的字符识别,得到各个识别区域的字符内容,最后进行识别结果的保存和导出。

4 应用场景

电力设备铭牌图片经过OCR的文字识别,输出得到可编辑的文本信息,电力公司可将该信息保存为电子档案信息,便于日后的维护及与设备厂商的沟通联系。

(1)首先用户操作加载采样图片。

(2)图片预览。

(3)图片识别后的信息预览。如图2、图3所示。

(4)已识别数据列表功能:该功能默认显示以时间排序展示所有用户已识别的识别,其中包括识别设备的时间、识别设备的名称,识別设备的用户。用户可以通过筛选方式显示某一段时间内的识别设备。如图4所示。