电力设备铭牌照片识别器

2019-02-14 06:02刘庆李义李鸿杰陈茜

中国科技纵横 2019年23期

刘庆李义李鸿杰陈茜

摘要：电力设备铭牌图片中，其文字的排版格式不一、字体格式复杂多样，在电脑端OCR文字识别软件基础上，研究出一种自然环境里中文文本的检测与识别，并开发具有该相关功能的软件，应用在电脑端实现OCR的应用场景。

关键词：电力设备铭牌;文字识别;OCR

中图分类号：TM63 文献标识码：A 文章编号：1671-2064（2019）23-0131-01

1 问题

目前电力系统中运行的各类设备，其设备铭牌上提供了设备的品牌、厂家、型号、产品名称以及各类电力参数信息，在电力生产过程中，电力公司需要熟悉这些技术参数，便于了解设备的性能，记录设备的技术参数存档。同时在维护过程中，需要通过这些信息，让设备厂家的客服能迅速了解设备可能的问题。由于各种电力设备的生产厂家生产的设备铭牌，其风格差异很大，采用现有的OCR识别系统，无法满足实际工作中众多电力设备铭牌的识别需求。

2 背景综述

目前电力系统运行中的设备铭牌照片采集时，通过手机或者相机采集的照片很不规范、且铭牌照片收集后，需要花费大量的人工进行照片上设备参数的识别，特别费时费力，且因各种原因，人工识别照片上的数字时经常会存在疏忽，造成部分设备参数不准确。通过电力设备铭牌照片识别技术的应用，可以规范快速安全采集铭牌照片，完成在自然环境里中文文本的检测与识别，收集到设备的电气参数信息。

OCR的识别过程，分为以下几步：图像获取、图像的预处理、特征提取、文字的识别、版面恢复、后期处理以及校对等功能组成。

（1）首先需要将图像进行载入，目前常见的图像格式有JPEG、PNG、PDF、IMG等图像格式，不同的图像格式分别有不同的存储格式、以及不同的压缩方式。

（2）图像的预处理主要包括灰度化、二值化、去燥、倾斜度调整、字符切割等。第一步是图像二值化采用阈值分割技术，擅长处理物体与背景具有强烈对比度的图像分割。可以把通过相机拍摄的铭牌图像简单地划分为前景与背景区域，对划分区域的彩色图像进行灰度化处理，在图像灰度化处理之后只含有前景色和背景色，通常情况下前景信息用黑色表示，背景信息用白色表示。第二步是去燥，所谓去燥就是对图像进行噪声去除，对图像文件上定义噪声特征，然后根据这个特征完成去燥处理。第三步是图像倾斜度的调整，就是在实际的拍照环节中，人们往往很难做到图像的完全水平垂直，使得拍摄的结果图像会出现一定的倾斜，为了让计算机更好的识别图像上的文字信息，需要对倾斜的图像进行水平或垂直调整，最后得到一个水平垂直的图像结果。

（3）特征提取，该步骤是希望找出图像中候选的文字区域特征，将图片划分N个段落，改过程就是版面分析，但实际图片的复杂性和多样性，因此不会有一个固定不变的最优分割模型。

（4）文字识别，字符识别方法特征提取方法为主。主要分为两类：一类为模式识别，向OCR程序喂送各种格式的字符用来识别、对比文档中的字符。另一类为特征检测，OCR程序使用一套规则来识别电子文档中字符和数字的特征。这些特征包括斜线、交叉线或曲线的数量等。例如，大写字母＼“A”＼可以存储为两条对角线中间与水平线相接。

（5）版面的恢复，就是在对识别出来的文字，按照原有图像文档的先后顺序，保持其原有上下左右的段落位置不变，按顺序的输出为可编辑的文字内容，可导出为pdf、word等格式文档。

（6）后期处理及校对，对于得到的文字内容，根据其特定的语言及上下文关系，对结果进行最后的校正，得到最终的可编辑的文字内容。

OCR程序有不同的算法来实现，但总的来说都是基于字符、词语或文本块来识别。当字符识别成功后，会被转换成ASCII码，用来作进一步处理。用户可以存储为电子文档，识别并纠正文字或复杂格式方面的错误。计算机视觉技术让计算机程序或者叫机器人能够看懂图像，并能够识别出图像中的元素，而不是靠人工配置的选择器识别图像。计算机视觉技术是一种算法，这种算法通过混合使用人工智能、OCR、文字模糊匹配和锚定系统，实现类似人类的图像识别能力。

OCR技术提供一种可靠的技术手段，实现了电子图片上文字信息进行数字化的转换，对特定格式图片内容进行算法识别，让OCR在日常的生活和工作中进行了众多的应用。

对于电力设备铭牌印刷形式的多样性，本研究项目提出根据设备铭牌图片实际情况，自动对图片中文字进行识别，并以可编辑的自由文本输出识别结果，以解决在自然环境里无特定样式的图片中文字识别，提高OCR技术在实际自然场景下的应用能力。

3 方案设计

电力设备铭牌上的信息，包含厂家的品牌、产品型号、生产日期、产品名称、设备电气参数等信息。在进行识别时，需要自动选定识别区域，通过各个识别区域的自动识别，获取设备铭牌上的文字内容。

选择电力设备的图像并输入后，经过一系列的加工和处理，包括文字方向校正等，使得文字基本能达到水平位置，得到一张可用于识别的图像。系统自动选择可识别区域，如图1所示。

然后依次进行各个识别区域的字符识别，得到各个识别区域的字符内容，最后进行识别结果的保存和导出。

4 应用场景

电力设备铭牌图片经过OCR的文字识别，输出得到可编辑的文本信息，电力公司可将该信息保存为电子档案信息，便于日后的维护及与设备厂商的沟通联系。

（1）首先用户操作加载采样图片。

（2）图片预览。

（3）图片识别后的信息预览。如图2、图3所示。

（4）已识别数据列表功能：该功能默认显示以时间排序展示所有用户已识别的识别，其中包括识别设备的时间、识别设备的名称，识別设备的用户。用户可以通过筛选方式显示某一段时间内的识别设备。如图4所示。

中国科技纵横2019年23期

中国科技纵横的其它文章: 浅析生物除臭工艺研究与应用; 环卫工程城市生活垃圾处理技术; 黄河银川段近五年水质现状分析及治理措施; 新形势下的内河航道生态护岸工程技术研究; 桃江县畜禽养殖业环境污染现状调研报告; 邯郸市地下水超采综合治理浅析