古老的苏州方言活起来

2023-05-30 12:40陶瑾陶园琦
现代苏州 2023年9期
关键词:姑苏语料发音

陶瑾 陶园琦

1977年,吴方言被收录进一张金色唱片中,跟随美国国家航空航天局探测器“旅行者1号”从地球出发,开启太空之旅。43年后,一首吴方言版的童谣《摇啊摇,摇到外婆桥》又被制作成音频,随着长征六号遥三运载火箭的成功发射,驶向浩瀚的宇宙。

方言似乎离我们越来越远。夯拨郎当、吃生活、拎勿清、来三、花里吧啦……你还会说苏州闲话吗?方言式微,江南软语今犹在?随着城镇化进程和网络传播的发展,方言在年轻人文化圈层中的声音渐渐淡出,随之消失的不仅仅是一种发音、一些词汇,还有方言背后积淀的文化因子。

进入人工智能新时代,就得用新技术新办法。科大讯飞(苏州)科技有限公司(以下简称苏州讯飞)运用AI力量,让苏州方言焕发新生,也让更多年轻人产生了对乡音的情感共鸣。

让AI说一口流利的苏州话

面对方言的日渐式微,2017年讯飞输入法发起“方言保护计划”,2018年苏州讯飞落地苏州以后,也开始了对苏州方言的技术化保护与开发应用。

AI就像一个天马行空的“孩子”,让它“说”出一口相对标准的普通话已经很难,更别提要合成有着28个声母、49个韵母、8个声调的苏州话了。在苏州方言语音识别与合成系统研发过程中,大小挑战接踵而来。让AI学会说苏州话,机器既听得懂又能说得出是重要的技术要求。因此苏州讯飞寻找地道母语者、专业发音人、评弹老师、具有代表性的专业机构等,请他们共同录制语料、筛查语法规则,通过语料资源的采集与标注,训练AI模型的方言能力。

苏州话源远流长,今日的吴语发音者稀缺,加上吴语地区方言分布广、地域差别大,所谓“十里不同音”,这些都为收集相对标准的方言语料带来难度。“为训练苏州方言识别系统而录制方言语料的过程中,需要选择标准的地区、标准的语料录制人。而在训练方言合成系统过程中,发音人的选择需要满足合适的代际标准,苏州方言分为‘老、中、新三个派别,而‘中派则是讯飞团队进行语料录制的要求之一。此外文白转译能力、地道化表述能力及对变调的标准把控等,都在发音人选择标准之中。”苏州讯飞苏州方言研发项目负责人于馥源介绍。

为此,苏州讯飞做了许多尝试。在选择发音人时,考虑到发音人的社会角色和听众的感受,尽可能保证录制到发音相对标准且听感舒适的语料,这一过程耗费了大量时间和精力。今年,讯飞计划录制6000至8000句男声语料,来初步丰富合成端发音角色,而此项工作,至少需要近一年时间才能全部完成。苏州讯飞技术团队用了几年时间,识别端累计采集并标注苏州方言地方语料1100余小时,合成端累计积累语料共1.7万余句。同时整理迭代大量书籍选定语言规范,优化“正字表”等基础工具,让AI模型不断训练发音,目前讯飞输入法字识别率已提升至84%。

用故事唤醒乡音

2021年,一部苏州方言演绎的古装短片受到很多人关注。片中纯正的吴侬软语旁白,让很多人印象深刻。而这样的吴侬软语,竟然是用高科技合成的。

《姑苏琐记·金缕衣》讲述了明代姑苏城外,几位不同出身的女性之间相互扶持的故事。片中除了精美的器物和华美的服饰外,由AI语音技术合成的吴语旁白,是本片一大亮点。之后苏州讯飞又推出姊妹篇《姑苏琐记·懒画眉》和《姑苏琐记·天仙子》。《姑苏琐记》系列短片将人工智能方言技术新颖地加入文艺创作中,发声腔调、语音语气都透着真切,显得自然贴近,仿佛带来了一场时空穿越,将屏幕前的年轻观众带入历史情境中。

“这三部曲是我们和古风UP主‘蜃楼志studio一起出品的‘方言保护计划公益短片。当时我们决定拍摄这一系列短片,主要是因为志趣相投,双方都希望为方言保护贡献一份力量,试图通过当下年轻人喜欢的视频形式去呈现方言的美,传达苏州方言值得被传承、被听见、被习得的理念。”于馥源告诉记者。在创意阶段,他们参考了《吴郡岁华纪丽》《长物志》等地方古书。苏州地方文化多而庞杂,时代变迁也对文化产生很大影响,如果从大处着眼,很难用8分钟的视频体量讲清楚。最是人间烟火动人心,平凡人的生活片段,既能表现地方四时不同的习俗风物,也能看到方言沟通中的地区思想特点。

据悉,《姑苏琐记》前两部的画外音和第三部中“天仙子”的声音,都是借助“科大讯飞AI苏州方言合成系统”配音完成,语调婉转和真人发音无异。尤其在第三部中应用了苏州讯飞首次推出的古风高保真数字孪生虚拟人“雨笙”,与元宇宙的跨界联动,构建了全新的互动体验。说到数字孪生虚拟人“雨笙”,对比常见的虚拟人,苏州讯飞团队的着眼点从“更美”转换到“更真”,把握细节,力求真实,为未来元宇宙中人的形象,拓宽了想象空间。

语言从来都是越用越活的。当下,方言已经从一个交流的工具蜕变成一个文化的符号和情感的纽带。

为数字产业装载文化心脏

保护方言需要做大量的幕后工作,让AI会说苏州话只是方言保护的第一步。如何让AI苏州话走进生活场景,让更多人领略吴地文化的美,尤其是探索年轻人与地方文化之间的关系,才是让方言真正实现“被感受、被使用”的创新路径。

2021年,苏州讯飞与苏州博物馆跨界合作,发起“用姑苏软语传承千年文化”活动,将苏州话与馆藏文物结合,借助方言讲述文物历史的形式,让人们足不出户“云赏”苏博珍品。去年,苏州讯飞联手苏州市非遗办,启动非遗数字化项目,开展非遗作品高精三维数字扫描及AI苏州方言有声播报项目。近百件数字非遗作品“云端”上线,观众一边倾听人工智能的方言解说,一边近距离全方位觀赏数字化非遗精品作品。现阶段,苏州讯飞又与广州美术学院及苏州博物馆联合打造AI方言艺术装置,以更有趣、更接地气的方式,渗入苏州人的日常生活。目前已有7个作品成型,今年将在苏博亮相。届时参观者可以身临其境地观赏艺术与技术的链接,与AI方言艺术装置进行交互。

尽管越来越多数字文化产品受到年轻人的推崇和喜爱,苏州方言的“接力棒”也渐渐回到年轻人手中,不过当代人还需探索方言的多元表达,开辟数字文化应用新场景,不断用人工智能讲好苏州故事,推动传统文化的“破圈”传播。

猜你喜欢
姑苏语料发音
悠悠姑苏情,酥脆“蟹壳黄”
姑苏繁华地 吴中第一镇
姑苏好时光
姑苏城外寄乡愁
基于语料调查的“连……都(也)……”出现的语义背景分析
Playing with h
华语电影作为真实语料在翻译教学中的应用
Playing with /eI/
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法