智能审核分析系统设计与应用

2023-07-29 16:24高尚清
电视技术 2023年6期
关键词:站点模板分类

高尚清

(浙江广播电视集团,浙江 杭州 310005)

0 引 言

近年来,浙江广播电视集团(以下简称浙江广电)致力于推动媒体融合纵深发展,加快将人工智能等新兴技术应用于信息采集、生产、传播等各环节[1]。传统的媒体节目制作流程中,三级四审制度主要依靠人力完成。近年来,新媒体行业兴起,大小屏联动发展,传播内容愈加繁多。依托传统模式审核效率低,且难以对现有媒资通过智能化标签等条件进行检索。为应对愈加繁重的媒体内容审核、内容价值挖掘任务,研发、建设一套智能审核分析系统,辅助提高内容审核与分析效率,尤为重要。

智能审核分析系统,依托浙江广电莫干山路数据中心,利用原子能力打造媒体新型内容审核、分析流程;利用中心现有的计算资源与转码、迁移等基础组件实现对各类节目素材与成片的审核分析结果在线预览。系统包括业务监控、智能审核分析、系统管理等模块,支持配额管理与用量统计,便于后续计费和数据分析。本项目的实施,优化了传统节目审核方式,助力内容分析以及智能化检索,提高了媒体制作效率,满足新时代广电行业生产需要。

1 总体架构

智能审核分析系统依托“浙江广电莫干山路数据中心”基础设施即服务(Infrastructure as a Service,IaaS)资源池,包含对象存储、数据库实例、K8S 容器管理平台等服务,实现系统的高可用性;依托中心转码等平台即服务(Platform as a Service,PaaS)层服务,对媒体内容进行转码,统一生成低码率文件组,方便用户预览以及后续流程调用;通过预设个性化模板,驱动后台流程,取得对应的审核分析结果;支持多站点模式,每个站点及站点内用户数据隔离,可对每个站点及用户单独设置智能处理的类型以及配额,并对其用量进行统计;对接中国蓝云平台、Z 视介等业务平台,支持以单点登录、应用程序编程接口(Application Programming Interface,API)调用等多种方式进行接入,便于现有业务及其他业务系统便捷对接[2]。系统总体结构如图1 所示,主要包括业务监控、系统管理、基础组件以及智能审核分析四大功能模块。

图1 智能审核分析系统架构图

1.1 业务监控

业务监控模块主要负责提供各类对外API、内部接口转发、模板配置以及三方对接。用户可按实际需求配置智能审核、分析模板;流程驱动后返回给应用系统的内容根据模板进行匹配,显示模板已勾选的类型以及高于阈值的相应内容。“中国蓝云平台”、重大文化传播平台的核心载体“Z 视介”现已通过单点登录、接口调用等方式正式接入使用。

1.2 系统管理

系统管理模块包含租户管理、用户管理、权限管理以及配额管理四大功能。智能审核分析系统按需进行租户化部署,各个站点共享基础组件以及业务监控功能,用户及业务数据相互隔离。用户管理提供用户的注册、编辑、权限分配和配额等功能。权限管理可通过设置不同角色对应多重权限需求,便于管理及保障流程、数据安全。配额管理支持首先给各个租户站点分配一定的智能能力使用额度,其次该站点下所有用户可用的总额不超过该站点本身配额;同时支持配额软性阈值设置,即此模式下超过设定配额限制,系统可提醒该租户管理员相关情况但不限制用户继续使用,有利于适配不同用户、不同场景的管理模式。

1.3 基础组件

基础组件包含了K8S 集群、对象存储、数据库实例及缓存服务等。智能审核分析系统的各个服务通过容器化方式部署,各个容器相互独立,进程不会互相影响,具备可扩展、自动化的特点,可通过设置策略实现服务的弹性扩缩容,在不浪费底层资源的前提下保障系统稳定运行[3]。上述资源面向系统各个租户、用户开放,具备可扩展性同时便于优化升级。

1.4 智能审核分析

智能审核分析涵盖多媒体内容分析、内容审核、特征库以及统计分析四大功能。系统支持用户通过手动创建或者接口请求方式根据模板发起任务流程,支持视频、音频、图片和文字多种形式的媒体内容,同时支持新建人脸库、机构库和Logo 库等自定义特征库。用户可将创建的特征库与流程模板进行绑定关联,实现对特定人物、图像的审核分析需求。系统支持按照用户、租户维度进行资源使用情况分类统计,同时具备配置计费规则,基于额度用量进行计费,丰富系统运营能力。

2 系统详细设计

2.1 设计目标与原则

本系统的设计目标是开发一套智能审核分析系统,保持对新技术的战略主动;通过对新技术的深入研究与主动跟进,推进媒体深度融合发展,为节目内容制作和审核提供支持[4]。

系统基于浙江广电莫干山路数据中心的容器服务、云数据库等统一设计,采用restapi、插件化方式进行数据交互;采用云转码、对象存储(Object Storage Service,OSS)和服务器负载均衡(Server Load Balancer,SLB)等先进的技术和产品,符合广电行业发展趋势。智能审核分析系统上线后,助力现有业务及用户内容安全审核和媒体内容生产参考,满足先进性要求;依托本地化部署的阿里云平台,包含Web 应用防火墙(Web Application Firewall,WAF)、云监控(Cloud Monitoring Service,CMS)、高速通道等功能和资源,保障媒体内容安全传输,满足高安全性要求。

2.2 智能审核分析服务

智能审核分析服务支持对视频、音频、图片和文本等类型文件发起审核或分析任务流程。对应的文件上传方式包含Web 上传、Http 文件识别、存储扫描(包含nas、oss、ftp);同时支持任务进度可视化呈现,实时进度查看。智能处理完成后,最终各数据结果进行聚合,回调给业务系统进行展示。系统还具备任务流程状态消息通知能力,可以将任务的每一个步骤更新后的信息和最终结果以结构化数据的形式回调给用户。具备相应权限的用户根据实际情况,如当任务失败时,可对已发起任务进行批量取消、删除和重置操作。具体流程步骤如图2 所示,详细介绍如下。

图2 智能审核分析流程图

(1)用户上传视音频等素材,选择任务类型和模板或传递相应参数,通过接口发起任务;

(2)系统会对收到的任务中带有的鉴权信息进行校验,通过后抽取元数据信息;如果是视频类型,对原视频进行转码、抽帧,提取封面和音频,再下发给智能算子进行处理;

(3)算子结果经过数据聚合,回调给业务系统进行展示;

(4)在系统页面中,可根据任务名称、任务状态、使用模板、创建时间和任务最后更新时间进行查询。

2.2.1 智能分析

智能分析功能支持对视频、图片和文本等媒体内容发起任务。用户可对完成的任务进行在线预览视频、图片内容;智能分析功能可以根据模板提取出视频、图片中的标签信息、人脸信息、语音文字信息及Logo 信息等。

标签信息首先会根据收到的结构化数据进行标签分类,如地名、机构组织、场景、人物等进行展示,然后再将相应结果呈现至各个分类中。人脸信息中,可查看系统识别出的人物,包括人物姓名,人物出现的关键帧、时码和置信度等信息,并支持点击时码在预览窗口中跳转至相应的视频内容处,帮助用户快速定位[5]。语音文字信息处理方面,通过对媒体内容进行音频提取、语音转文字和OCR 处理,系统按时间顺序展示识别出的文字信息,可通过输入关键词方式进行检索查询,并支持以srt 或excel 形式导出,方便用户进行二次加工处理。Logo信息模块中可识别出媒体内容中的Logo、水印等信息并进行呈现。

2.2.2 智能审核

智能审核服务对用户发起的视频、图片、语音和文本进行审核。审核结果通过智能处理结果的置信度与相应模板匹配后,以人工智能(Artificial Intelligence,AI)确认结果、AI 疑似结果方式呈现。用户可在模板中勾选涉黄、暴恐、涉政、违禁、广告和低质等六大一级分类,每个一级分类下又细分为二级分类以及对应的三级分类。以暴恐为例,下有二级分类如暴力事件,暴力事件又可分化出枪械、刀具、血腥等三级分类。

用户可勾选所需分类并对每一个三级分类设置确认阈值和疑似阈值。当发起的智能审核任务出现对应的三级分类内容,且结果的置信度高于模板设置确认阈值时,可以在AI 确认结果模块中的对应分类下查看具体结果,含有名称、出现的关键帧、时码和置信度等信息,支持快速定位。当结果的置信度处于确认阈值和疑似阈值之间时,同理,可在AI 疑似结果模块中查看。当结果置信度低于用户设置的疑似置信度时,系统将过滤相应信息,不在可视化页面展示。

为确保媒体内容安全制作播出,智能审核模块可对完成的智能审核任务进行人工复审修订。用户可反馈遗漏违规点,新建词条、分类及片段。

2.3 特征库

上述人脸、Logo 和文本等内容模块均支持任务模板与自定义特征库相关联。以Logo 为例,通常情况下,本系统可审核、分析、识别出媒体内容中出现的较知名或违规Logo。当用户需要审核特定Logo 时,可新建Logo 特征库,将特定Logo 以图片、名称方式上传,经站点管理员审核认可后入库至该特征库。具体流程步骤如图3 所示。

图3 特征库新建数据流程图

添加数据成功后,用户可将该特征库与模板中的指定分类进行关联,后续发起的任务即可识别此Logo 并可视化展示。

2.4 统计分析

系统对租户站点以及单个用户按智能能力类型以及对应额度、任务类型进行分类统计,便于对单个站点的使用特点进行分析。同时,系统管理员可见所有租户站点分配以及已使用额度的总体情况,为底层智能处理能力类型及数量资源规划提供决策依据[6]。系统界面如图4 所示。

图4 统计分析展示图

3 结 语

随着高新技术发展与媒体行业的不断变革,节目的制作已不完全局限于以往的纯人工模式,智能审核分析系统应运而生,协助现有业务兴利除弊。此外,系统优化了审核流程,降低出错风险,同时通过智能标签化信息提取等方式,对已有内容归纳溯源,在为打造全新作品提供辅助参考等方面发挥了重要作用。

猜你喜欢
站点模板分类
铝模板在高层建筑施工中的应用
铝模板在高层建筑施工中的应用
分类算一算
基于Web站点的SQL注入分析与防范
分类讨论求坐标
2017~2018年冬季西北地区某站点流感流行特征分析
数据分析中的分类讨论
教你一招:数的分类
首届欧洲自行车共享站点协商会召开
怕被人认出