广播媒体与人工智能技术的融合创新

2023-12-18 20:41
电视技术 2023年9期
关键词:音频广播语音

封 寒

(江苏省广播电视总台,江苏 南京 210009)

0 引 言

当前,人工智能日益成为引领新一轮科技革命和产业变革的核心技术,在各个领域的应用场景不断创新、落地,尤其ChatGPT 在2022 年11 月正式上线后火速出圈,GPT-4 在2023 年3 月上线再次引发全世界的关注。毋庸置疑,人工智能正在极大地改变人们既有的生产生活方式。

近年来,随着智能语音、自然语言理解、大数据、人工智能(Artificial Intelligence,AI)算法等技术的不断升级与日益成熟,广播媒体与人工智能的深度融合助力内容生产流程的改革,为广播媒体重塑了生产力、提高了工作效率。同时,广播媒体各方面业务、产业也积极与人工智能多维互动、融合渗透,助力广播媒体孕育更具智慧的新场景、新业态、新模式。而正在到来的人工智能生成内容(Artificial Intelligence Generated Content,AIGC)将成为新的生产力引擎,给媒体行业带来新一轮的内容革命。

1 人工智能构建内容生产新流程

随着媒体使用场景的改变和新技术的应用,当前社会已经悄然经历了多种内容生产形式的迭代,如专业生产内容(Professional Generated Content,PGC)、用户生产内容(User Generated Content,UGC)以及人工智能辅助内容生产(Artificial Intelligence User Generated Content,AIUGC)。人工智能正在参与内容生产的各个环节。人工智能技术的应用助力内容生产流程的升级改造,在使内容生产更加标准化的同时,极大地提升了内容生产效率。

1.1 新技术助力高效采编

在选题策划阶段,通过大数据的收集、分析与比对,可以帮助编辑快速判断选题、确定舆论热点,进行相关的内容策划。在采访与音频资料的使用方面,语音识别技术尤其是语音听写和语音转写技术给音频文件的处理带来的极大便利。记者可边采访边实时返回文本数据,对大型的音频文件可实现文本快速转换。

在内容编辑生产阶段,一些智能化的应用可实现辅助内容生产的作用。2017 年,江苏省广播电视总台(以下简称江苏广电)运用人工智能技术研发了一套AI 内容编译系统,通过整合第三方语音识别技术和Unix 开源人工智能引擎,打造出符合广播节目生产的人工智能系统。

1.2 虚拟主播促进节目创新

智能语音技术在广播行业运用较早,其智能语音合成技术可将文字转化为自然流畅的人声。语音克隆是语音合成技术的一个分支,通过采集需要的人声语音数据,将其训练成为一个语音合成的模型,就可以克隆出一个声音。此技术可广泛地用于听书阅读、新闻播报、语音导航等领域。2023 年,中央广播电视总台(以下简称中央台)的云听App 联合中国之声,组成“两会报道融媒联盟”,推出AI 主播团体IP“云小天团”创新两会报道;2023 年,江苏广电大蓝鲸App 与江苏交通广播网联合推出了“鹰眼出行”融媒产品,其中路况智能语音播报是产品的一大特色,便于开车人在驾驶状态直接收听路况信息。

AI 虚拟人技术则更为复杂,在AI 技术的运用上涉及语音合成、语音识别、语意理解、图像处理及虚拟形象驱动等技术,在呈现效果上也有更高的要求。广东广播电视台粤听App 针对大湾区Z 时代用户布局元宇宙,在2022 年推出全球第一个粤语虚拟偶像“悦小满”,并在粤听App 开设虚拟电台和直播节目。

1.3 智能化审发增速内容运营

广播媒体对内容的审核要求是非常严格的。除了常态的广播节目内容,还有大量的新媒体内容的产出。对于如此海量的内容,利用人工审核,需要花费很多的时间。人工智能技术的自然语言处理、图像识别、声纹识别等技术已经广泛应用到内容审核中来。在人工智能技术的帮助下,经过深度学习的智能审核系统可实现对文本、图片、语音及视频中有问题的内容进行提示,再经过人工核准,使审核工作变得精准高效。辽宁广播电视集团的北斗融媒客户端,在其后端的全媒体制播云平台云的AI智能化模块中增加了智能审校等功能,极大地提高了内容审核的效率。

内容分发传播运营的初期主要是由人工运营决定。随着内容生产能力的提升,优质内容越来越多,用户在面对海量的内容时,需要快速寻找自己可能感兴趣的内容。在这一场景下,通过记录用户行为数据,以此为基础构建用户画像特征,通过模型测算出用户的兴趣与偏好,从而把个性化内容智能分发给用户,可呈现千人千面的效果。

1.4 智慧广播助推内容体系建设升级

智慧广播是广播与智慧化技术综合运用的产物。智慧化技术包括人工智能、大数据、云计算、5G、区块链等新技术,通过对传统媒体采、编、播、审、存等业务流程场景的智慧化升级,实现广播从内容生产到安全播出,从内容创新到产业转型,从流程再造到资源重组的全方位的智能化战略转型,使广播在内容、安全、传播、服务及效率等方面实现全面提升。

以云听App 为例,其以构建5G+4K/8K+AI 的战略格局,打造“云听AI 广播”。该系统以AI 智能技术为基础,以云听海量的优质内容为支撑,将智能化的广播播出系统与高品质的音频内容结合,通过智能抓取、智能播报、智能编排、智能审核、AI 智能主持以及内容智能管理,可一键生成24 h 电台节目,并实现用户的区域化个性推送。

一些有条件的省级台和地方台也在一定程度上进行了智慧电台的探索。2020 年,湖南广播电视台推出iMango 5G 智慧电台项目,其利用大数据、云计算、人工智能、区块链等技术作为其核心技术,人工智能在采编播所有环节都发挥作用,包括智能编排、智能审核及AI 虚拟主播等[1]。湖南广播电视台还建立了湖南第一个广电行业地方标准《5G 智慧电台系统技术要求》。2023 年,深圳广播电台首个5G智慧电台在深爱听App上线,全天24 h滚动播出,AI 主播全新上线,AI 智能系统实现数据信息的自动抓取、智能编排、智能审核、智能分发及智能播报,一键式自动化生成。

2 人工智能赋能广播新生态

2.1 智能互动新模式

广播媒体一直以来非常注重与听众的互动,从最早的书信往来到热线电话再到短信、QQ、微信互动等,互动的媒介和形式在不断变化。而现在,时间资源被各种应用争抢和挤占,广播互动要紧紧抓住广播声音特色,与语音听写、语音搜索、语音唤醒及语音合成等技术相结合,提升用户的智能化互动体验。

江苏广电大蓝鲸App 在全国首创“大蓝鲸live互动”功能,搭建了微播云系统管理平台对互动数据进行管理。系统支持图文音视频全媒体形态的互动传播,尤其创新智能语音互动模式,用户发布语音在微播云系统通过语音识别技术将语音智能翻译为文字,极大地提高了导播的审核效率。在互动语音的发布环节,系统实现了多渠道智能化发布。一方面,微播云管理后台与广播的制播系统实现打通,语音在审核通过后,筛选出的精华语音可直接发布到广播节目中播放。另一方面,微播云管理后台也将大蓝鲸App 和江苏广电官方微信的后台数据和参与通道打通,所有语音数据在审核后均可实现在两端的同步发布。

北京广播电视台音频客户端听听FM 研发了“你好,小听”广播直播智能语音互动系统,通过“你好,小听”语音唤醒,触发用户与传统广播之间的连接。用户可使用自然语言与节目互动[2]。

2.2 可视化广播新业态

随着虚拟现实(Virtual Reality,VR)、AI 和5G 技术的发展和普及,广播媒体正在通过融合传播手段迎接“可视化广播”时代的到来。“可视化广播”不是做电视化的广播,而是对原有广播形态的扩展和补充,具有以下意义。首先,广播为了提升影响力,需要不断扩展传播生态,要积极拥抱各类传播平台,而广播媒体天生的直播属性与大流量的视频直播平台可相融通;其次,广播在产业和营销上的扩展,也需要不断创新业务模式,可视化广播将互动与营销深度捆绑,助力实现经营增量;再次,智能化的拍摄与导播设备也使广播可视化更为轻量。新技术降低了可视化广播的建设门槛。

中央台中国之声和经济之声等广播频率开设的视频直播间配备多通路高清摄像头,实现“多条分轨视窗”+“多屏自由拼选”的5G 时代广播可视体验。受众可通过留言、点赞等方式与主持人展开互动。

江苏广电大蓝鲸App 也在“可视化广播”领域积极探索,创新广播直播间轻量级视频直播方案,引入AI 摄像头设备与AI 导播软件系统,一人便可操作整场直播。该方案于2023 年在音乐广播30 周年直播活动中上线试水,连续12 h的直播安全稳定,为大蓝鲸App 的live 互动直播间改造升级做好了技术准备。

2.3 智能终端新场景

根据赛立信媒介研究公司的数据统计,广播音频传播平台呈现多元化的传播特点。2022 年,广播媒体传统收听出现略微下滑,但是广播音频智能终端用户规模突破4 亿人,同比增幅达10.8%。除了智能手机仍是音频收听的主要阵地外,智能语音技术为内容传播开辟了新市场,吸引了越来越多的广播媒体与智能车载、智能平台等智能终端相连,以触达到更多的用户[3]。

江苏广电大蓝鲸App 自2022 年开始进军车载应用领域,为用户提供丰富的出行体验,先后上线了苹果Carplay 和华为HiCar 车机应用,用户在驾驶中可通过车机收听江苏广电十大频率在线广播,回听海量精品音频节目,并且在技术上智能同步收听历史,将功能操作与方向盘完美融合,让驾驶用户的收听更享受、更安全。

北京广播电视台听听FM 利用新技术赋能传统广播,与华为、阿里、腾讯、科大讯飞、小米等头部互联网企业开展智能生态合作业务,不断扩展智能化生态。在车载领域努力触达更多的预装车机应用终端,依托阿里斑马、腾讯随行、华为等系统,构建出行场景车载轻应用生态。

2.4 多维应用新业务

人工智能技术的类型是非常广泛的。随着各类技术的成熟,人工智能技术通过不同的应用层切入,为广播提供各种业务智能化的解决方案。在技术底层架构层面,有智能化的系统构架;在系统应用层面,有智能化的资源库;在智能语音技术方面,有声纹识别、语音测评、情感化语音交互等技术;在智能图片处理方面,有AI 人脸融合、AI 作画等技术[4]。相关智能化产品也趋向多元化和综合化的应用形态。

贵州广播电视台动静App 以自主研发的系统分析与设计(System Analysis and Design,SAD)框架为基本架构,在此基础上构建了AI 个性化内容推荐、智能语音播报、全格式视频流直播流播放、电商、内容推送、微信端互通等多种立足于智能化App 的技术架构和功能体系。

上海广电集团阿基米德App 构筑了以人工智能和大数据为核心的专业智媒技术体系,包括自动化图文音视的内容重构能力,可以实现对音频的自动拆条、标签、摘要,自动聚合;具有领先行业的语音合成、语音识别及广告监播能力等。

3 AIGC 媒体传播新赛道

2022 年以来,ChatGPT 展现了强大的技术实力,AIGC 以其强大的生成能力带给人们极大的震撼。AIGC 基于AI 技术在生成算法、预训练模型、多模态技术等方面的突破创新,势必迎来更大的发展。AIGC 作为新的生产力引擎,开启了新一轮的内容生产革命。人工智能将逐步成为创作内容的生产者之一。AIGC 在新技术的支持下,对内容生产力依赖程度较高的行业如媒体业会率先受到影响并落地,而“AIGC+传统广播”将有望带来一场自动化内容生产与内容交互的变革,在生产方式和生产结构上会发生重大改变[5]。

3.1 AIGC 内容资讯生产解决方案

AIGC 内容资讯的生产可分为两种类型:一种是应用型文本生产,另一种是创作型文本生产。目前,应用型文本写作发展相对超前,一些大的媒体机构已经尝试了人工智能协助生产内容,尤其是对新闻稿件的撰写、固定格式文本的撰写以及风格改写等,相信在不久的将来能实现量产。对于创作型文本的生产,如剧情写作、营销方案写作等,由于其算法和模型的复杂性,还有很大的提升空间。

3.2 AIGC 音视频内容全新生产模式

AIGC 对音视频内容的生产将建立全新的生产模式,将对目前已经相当成熟的从文本到语音(Text To Speech,TTS)场景进行升级迭代,在有声内容的规模化制作、声音资源IP 产业化、视频智能剪辑制作以及虚拟人场景化直播等方面将迅速发展。

3.3 AIGC 跨模态内容综合生产能力

AIGC 跨模态内容综合生产能力实现了图片、文本、音频和视频之间的交叉流转,如文本生成音频、图像生成音频、视频生成音频等。知识体系的跨域流通,使得内容创作的门槛进一步降低。AIGC能够高效、快速地提供高度定制化、个性化的各类内容,使内容生产适合全媒体传播。

ChatGPT 的火爆为人们展示了AI 大模型技术是当下最流行的新技术。新技术催生新内容。传统媒体也相继开始抢占新赛道,提前布局拥抱新技术。希望新技术能够引领广电媒体技术产业的变革与升级。截至2023 年2 月17 日,全国累计有161 家媒体官宣接入百度“文心一言”,成为其首批生态合作伙伴,给传统媒体的未来带来巨大的想象空间。

4 结 语

AIGC 的到来,正在推动互联网、数据媒体乃至传统行业的全面改造和升级,以及生产力的全面变革。AIGC 模型的通用化水平和工业化能力的持续提升,将极大降低内容生产和交互的门槛和成本。当具备与人类同等智慧或者超越人类智慧的人工智能AGI(强人工智能)技术出现,与众多学科和领域交叉、融合之后,将颠覆所有人的想象。未来,“AIGC+”必将深度赋能各行各业高质量发展,为世界创造无限可能。

猜你喜欢
音频广播语音
STK及IGS广播星历在BDS仿真中的应用
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
必须了解的音频基础知识 家庭影院入门攻略:音频认证与推荐标准篇
对方正在输入……
基于Daubechies(dbN)的飞行器音频特征提取
广播发射设备中平衡输入与不平衡输入的转换
音频分析仪中低失真音频信号的发生方法
网络在现代广播中的应用