基于OCR技术的审计人工智能应用

2020-03-29 17:24朱皑绿李自宁
探索科学(学术版) 2020年12期
关键词:核查结构化发票

张 晶 李 杰 朱皑绿 李自宁

国网甘肃省电力公司 甘肃 兰州730000

前言

人工智能的迅速发展使其在我们生活的方方面面得以应用,极大的促进了社会的效率。审计工作作为企业经济活动的重要活动之一,将人工智能技术应用其中可以极大的提高审计的效率和质量,促进企业的良性发展,是未来审计工作发展的主要趋势之一。

1 基于OCR技术的审计的人工智能

OCR技术,即光学字符识别技术,指的是可以智能的分析识别处理图像文件,并将其转换为文字文件的技术。简而言之,它可以识别扫描图像文件中的信息并将其输出为文字文本。OCR技术出现的非常早,早在1950年代就已经成熟应用,随着其既是的发展,现已经应用与社会的方方面面。在企业审计工作中,需要大量的文本转化工作,但是由于面对不同的图像处理系统识别有所区别,这使得OCR 技术没有实现标准化和结构化的应用。比如就发票而且,在税改之前,企业中有多种发票,由于不同地区和不同类型的发票存在明显差异,这极大的影响了OCR及时的使用。而营改增后,这一问题得到有效缓解,极大的促进了OCR技术在审计工作中的应用。人工智能的发展也极大的促进了OCR 技术的应用,人工智能及时可以有效提高OCR 技术的识别能力和文本生成能力,提高审计的精准性和效率。

2 基于OCR技术的审计人工智能应用面对的困难

2.1 图像选择和分类的准确性 由于企业审计面对资料内容包含多种类型的数据,但就报销票据就包括增值税发票、产品明细表、实物图例、仓库收据其他图像数据等。因此,需要先对各种数据进行分类整合。而目前从机器人工智能的应用效果看,由于样本量大而训练较少,深度神经网络系统模拟效率仅为90%,与需求理论值相差甚远,并且会出现错误或遗漏问题。

2.2 信息识别的准确性 当前,OCR 技术应用最为关键的是图像信息的采集,主要由操作员使用配备的高拍仪完成采集。但是实际应用中,会出现诸如对焦错误、拍摄条件不佳以及拍摄角度不正确等问题,导致图像模糊和失真等问题。而在打印时会出现文本溢表格以及文本覆盖等文图,极大地影响了信息识别精度。

2.3 收集和存储数据的安全性 接收图像数据必须通过安全文件传输协议从图像系统中加载数据。在下载过程中,将不可避免地占用成像系统的带宽。另外,由于网络带宽的限制,图像和照片的下载速度很慢并且很耗时。如果在加载图像数据后没有专用的存储设备,则数据安全性受到损害。

2.4 人才队伍 将OCR 技术应用于图像处理,将大量非结构化数据转换为易于查看和分析的高质量结构化数据,需要与多核CPU,高性能显卡,大容量存储硬盘等高性能计算设备配套使用。如果没有适当的资源投入,存储的图像和照片的数量将受到限制,并且无法实现数据的长期储存,水人可以通过人工智能来提高图像数据验证的准确性并改善识别精度,降低人力成本,但同时也对人员素质提出了更高的要求。因此,进一步加强信息审计团队的组成,加快审计部门信息技术人员的技术培训,将是促进审计创新和发展的关键。

3 基于OCR技术的审计人工智能应用的优势

3.1 激活数据并扩展审计内容 按照传统的审计模型,内部审计只能分析主要业务系统和相关信息系统中的结构化数据。但是,数据库除有结构化数据之外,更多是大量的非结构化数据。借助人工智能,基于OCR技术的审计的审计模式可以有效的分析这些非结构数据,审计分析的内容和范围将进一步扩大,审计价值将得到有效提高。

3.2 丰富风险预警规则 以风险为导向的内部审计是近年来的发展方向,风险识别主要依靠审计辅助系统来提取风险数据。由于提取风险数据的规则主要基于结构化数据,因此非结构化数据信息很少,通常难以识别风险的所有来源。借助人工智能,实施基于OCR 技术的审计,将所有内容转换为电子数据,然后与现有结构化数据进行匹配,有助于内部审计及时识别风险,及时做出应对。

3.3 提高远程审计的效率和准确性,进一步降低审计风险 审计抽样是远程审计的主要工作。传统的审计模式主要使用两种方法来提取审计样本:一种是根据先前审计中发现的风险点来提取风险数据。另一种是获取审计区间的完整业务清单,根据经验进行手动评估和过滤,并提取样本。但是,随着业务规模的快速增长,样本抽样存在局限性,而基于时间和效率考虑,盲目增加样本量不现实。借助人工智能,实施基于OCR技术的审计可以有效解决这一问题,实现对大量数据的详细分析,提高远程审计的效率和准确性,进一步降低审计风险。

4 基于OCR技术的审计人工智能应用

4.1 商务活动核查 基于OCR技术的审计人工智能应用,可以跟踪业务进展,并快速确定是否存在违反纪律的证据并积极进行核查。主要有以下内容:

(1)核查违规购买问题,使用OCR技术识别发票、产品名称等,审核员可以通过现场采访和盘点来验证购买的真实性。

(2)核查超标购买问题,对于品牌营销,重要客户以及其他官方活动,适量购买是正常现象,但应避免奢侈。使用OCR 技术确定发票、产品名称和单价,并将其转换为Excel文本以进行比较和过滤。

(3)核查行程,报销差旅费时,使用OCR 技术确定车票类型,并监控使用车辆的行为。

(4)核查消费情况,识别发票并根据名称信息过滤有关费用,审核员可以结合现场访谈来了解实际情况,并确定消费情况。

4.2 高频交易和非标采购核查

(1)同一业务部门连续从同一供应商处进行多次采购核查。根据过去的审计经验,这种情况在很大程度上是持续的。使用OCR 技术提取诸产品名称和开票日期之类的信息以分析产品合理性,可以结合现场进一步核实资金的实际使用情况。

(2)核查同类物品的购买价格。使用OCR 确定发票产品名称单价,输出文本以核查同类产品的购买价格,并过滤出相差较大的同类产品,可以结合现场审核进一步验证。

结束语

在人工智能时代,内部审计不再只是核查错误和缺陷,而是更多地关注基于价值创造的整体企业发展状况,并为发展和转型做出贡献。人工智能可以利用自身的优势来收集、分析、汇总和分析大量数据,并从更高,更广泛和更全面的角度提供前瞻性审计建议。

猜你喜欢
核查结构化发票
改进的非结构化对等网络动态搜索算法
深度学习的单元结构化教学实践与思考
关于设计保证系统适航独立核查的思考
基于无人机影像的营造林核查应用研究
结构化面试方法在研究生复试中的应用
左顾右盼 瞻前顾后 融会贯通——基于数学结构化的深度学习
关于发票显示额外费用的分歧
食品检测实验室仪器设备期间核查实施方法
采购发票系统:全流程电子化实现
全国增值税发票查验平台启用