开创研发应用新范式 探索“用AI治理AI”

2023-07-10 05:41叶蓁蓁
传媒 2023年11期
关键词:实验室人工智能智能

叶蓁蓁

2023年初,ChatGPT诞生仅两个月,月活用户就突破1亿,成为史上用户增长最快的应用。回顾历史,月活用户达到1亿门槛,推特(Twitter)用了5年,脸书(Facebook)用了4年半,照片墙(Instagram)用了2年半时间。标志性平台产品出现,人类在经历PC互联网、移动互联网之后,正式进入智能互联网时代。现在看来,第三代互联网很可能是以智能互联为基础能力的价值互联、产业互联、虚实互联。

人工智能:有价值观的高科技

智能互联网时代,以通用人工智能为代表的技术加速更迭,将融合千行百业,驱动新一轮产业和技术革命。需要重视的是,人工智能在推动经济社会发展同时,也存在潜在的、不可忽视的技术伦理、价值观念等风险。人工智能大脑既是高科技的大脑,也是价值观的大脑。人工智能平台有立场,人工智能生成的内容有导向,所谓“技术中性”是不存在的。无论是喂养人工智能的语料数据,还是模型本身的算法,都必须高度关注政治方向、舆论导向和价值取向问题。

生成式人工智能(AIGC)技术正在重构内容生产、传播、消费、反馈全流程,智能传播大规模应用的序幕已经拉开。然而,生成式人工智能的不当应用,也引发了国内国际社会的担忧。今年2月,一条ChatGPT生成的假新闻在社交媒体上广泛传播,内容是关于杭州市政府3月1日将取消车辆限行。这条假新闻误导了很多市民,形成了小范围的舆情事件。欧洲社会许多国家已经开始或正在研究禁用 ChatGPT,全球许多教育机构、学术机构纷纷出台禁令,防止生成式人工智能被滥用。近期,全球千余名科技界人士呼吁暂停开发更先进的人工智能。这都表明,对生成式人工智能的治理已迫在眉睫。不能放任人工智能脱离人类视野,不能没有管理的“生成即传播”,要积极探索人工智能应用和治理之道。

参与人工智能的应用与创新

人工智能互联网时代,越来越多的行业、企业引入人工智能替代人类工作。未来人工智能虽然无法取代人工,但各行各业不会使用人工智能的人或将被淘汰。

主动适应。党媒党网必须加快发展,主动适应、参与人工智能应用和创新。近年来,人民网主动跟进下一代互联网发展趋势,以建设内容科技领军企业为目标,在人工智能领域,承建传播内容认知全国重点实验室,瞄准认知智能开展研发;建设人民链探索价值互联;建设828企业服务平台探索产业互联;建设灵境·人民艺术馆探索虚实互联。这些尝试只是起步,却能提振我们跨向未知的信心和勇气,未来人民网也将全力参与人工智能应用与创新。

创新研发。目前各界关注、舆论热炒通用型大模型,其技术路线是大模型、大数据、大算力、大资本、大平台、大团队的研究范式,费钱、费人、费电,并不适合所有国家、所有团队。智能互联网的时代刚刚开启,一方面我们不能大意、不能懈怠,需要发挥新型举国体制的优势,在别人证明成功的路径上抓紧发展,追赶超越;另一方面,我们也不能被打乱节奏,需要着力思考如何开创新的人工智能研发范式,走出一条“优模型、低能耗、高性价比”的新路径。例如,大力推进量子计算、类脑计算和光电计算;再如,在网络视听行业,根据网络视听任务的需求,发展专用中小模型,凭借网络视听行业的场景和数据优势驱动研发等。

人工智能的治理之道:“用AI治理AI”

2023年1月10日,国家网信办等多部委发布的《互联网信息服务深度合成管理规定》正式生效。4月11日,国家互联网信息办公室发布《生成式人工智能服务管理办法(征求意见稿)》,提出二十一条举措。业界认为,这是国内首次明确针对生成式人工智能服务征求管理意见,将有利于推动生成式人工智能产业健康稳定发展。

《生成式人工智能服务管理办法(征求意见稿)》规定了我国生成式人工智能需要符合五方面要求,包括体现社会主义核心价值观、避免歧视、公平、准确负责、隐私及产权保护,体现了国家对生成式人工智能在意识形态和法律伦理方面的要求。

人民日报对以上规定和管理办法做出积极回应,走出一条“用AI治理AI”的人工智能治理之道:依托人民网建设传播内容认知全国重点实验室,推出跨模态视频安全引擎“白泽”、涉政智能审核平台“人民审校”、舆论安全监测平台“谛听”和生成内容识别工具AIGC-X四款产品,初步建立智能化的安全风控体系以及人工智能意识形态风险评测体系。

人民日报社传播内容认知全国重点实验室,致力于服务国家重大需求、突破行业关键技术、解决行业痛点难题,打造传播领域的战略科技力量。实验室聚焦构建“传播智能体”,分别在主流价值观精准传播、内容智能审核、网络空间态势感知三个方向开展研发,通过人工智能技术,把新闻舆论工作中要牢牢把握的政治方向、舆论导向、价值取向,转化为可计算、可认知的人工智能技术体系,用技术赋能主流价值观传播,凝聚社会共识。

AIGC-X平台能够对人工智能生成文本、图形、视频内容进行精准识别,快速区分机器生成内容与人工生成内容。目前,该平台对中文文本检测的准确率已超过90%。

文本识别方面,实验室以语言模型的困惑度、词频特征为切入点进行的研究发现,人工智能生成模型倾向于采用高频词,而人类写作的选词则更具有随机性。基于此,实验室研发了语义与风格特征融合的语言模型评价方法,可以精准识别AI生成文本。

图像识别方面,人工智能生成图像的基本原理是通过对训练数据的学习,让人工智能模型能够提取图像的基本特征、结构和样式,并尝试在新的图像中融合和组合这些特征。但是这种生成方式目前缺少对视觉元素逻辑合理性、细节特征完整性的约束,不同特征区域融合的时候会出现问题。基于此,实验室研发了基于视觉上下文、子块信号特征的人工智能生成图像检测模型,实现对人工智能生成图像的精确识别。

视频识别方面,当前人工智能生成视频的应用主要集中在换脸、场景置入等局部内容的生成融合。人工智能生成視频目前无法完全模型人在真实动作中的语言、表情、姿态等复杂的生理特征关联性,因此,通过提取真实视频中人物的视觉、音频特征,建立人物关联特异性模型,可以检测出合成人物在全局一致性、几何特性等方面与真实人物存在的偏差。

另外,实验室还研发建设高质量的主流价值语料库,以支持各类生成式人工智能平台合规发展、安全发展、加速发展。通过建立常态化的运行维护机制,并随着政策法规及技术发展动态更新持续完善。

AIGC-X在内容版权、学术教育、虚假信息和学术造假检测等内容安全、内容风控方面有广阔的应用前景。例如,根据法律规定,人工智能生成的内容必须进行显著标识。AIGC-X可以服务于媒体的内容风控需求,提供人工智能生成内容标识、虚假信息识别等服务。还可以赋能教育、学术领域,可以用于防范学术不端行为,提供AI内容抄袭、论文造假检测服务等。

智能互联网时代刚刚开启,我们要立足长远,统筹发展与安全,重视安全才能更好发展,加快发展才能实现真正的安全。

作者系人民网党委书记、董事长、总裁,传播内容认知全国重点实验室主任

猜你喜欢
实验室人工智能智能
电竞实验室
电竞实验室
电竞实验室
电竞实验室
2019:人工智能
智能前沿
智能前沿
智能前沿
智能前沿
人工智能与就业