AI智能问答系统在档案咨询服务中的应用与研究

2023-05-04 04:36王雪荻刘世俭王玉吉
陕西档案 2023年2期
关键词:咨询服务知识库档案馆

文/王雪荻 刘世俭 王玉吉

人工智能技术广泛应用于社会服务领域,在档案智慧化管理服务中也逐渐崭露头角,本文基于人工智能中的智能问答技术赋能档案咨询服务场景,从可行性分析、系统架构、技术路径、业务应用四个方面对人工智能赋能档案咨询服务的可行性和效益性进行具体分析,以期为人工智能技术与档案管理服务多点结合探寻思路

一、人工智能在档案领域中的应用现状与前景

人工智能技术即机器模拟人的智能反应方式处理复杂工作,其技术根底是深度学习和类脑智能,主要应用场景包括生物特征识别、复杂环境识别、语言图像识别、人机交互、自然语言理解、智能决策控制等。全国档案事业发展“十三五”“十四五”规划连续提到了人工智能技术,“十四五”规划更是在“提升档案利用服务能力”和“加快数字档案馆建设”两个方面点明了对人工智能技术的加强,可见人工智能与档案结合前景广阔。从目前的实践看,公共档案馆和企业档案馆对人工智能技术的探索较为领先,如太仓市档案馆[1]、青岛市智慧档案馆、国网智慧型档案馆、科大讯飞自助进化语音语言开放创新平台[2]等,其应用体现在档案收集、整理、利用、安全管理等各个环节,但是从其应用深入和范围看,与物联网、云计算、大数据分析等技术相比,人工智能技术在数字档案馆、智慧档案馆的应用中占比非常小,通常以单一环节或具体功能为依托,且智能化程度多处于识别层面,未达到人机交互层和智能决策层[3]。(见表1)

表1

二、AI 智能问答系统赋能档案咨询服务的可行性分析及技术分析

1.可行性分析

智能咨询服务是基于自然语言理解、智能语音识别、深度神经网络学习等人工智能技术发展起来的一项机器人辅助咨询服务,目前在人工智能领域有较为成熟的技术背景和应用市场,从早期的苹果Siri、微软小冰等智能语音助手,到线上购物的机器客服,再到今天我们在商场、餐厅、图书馆、博物馆经常可见的导览机器人,都是智能咨询服务在虚拟和实体状态的应用成果,该技术的成熟为赋能档案咨询服务提供了较高的用户认可度和较低的技术成本。

当前快节奏的生活,人们对信息的个性化、精准化、即时化需求不断增强,传统档案咨询服务存在的覆盖面不足、程序繁琐、时滞等弊端日益凸显。尤其是随着数字档案馆、智慧档案馆的建设,“网端服务”“指尖服务”“云上服务”趋势不断增强,档案咨询方式也应当与时俱进,从人工转向智能,由被动转向主动,成为智慧档案馆建设的突出一环。

2.技术分析

AI 智能问答系统的设计,从其功能分析,包括用户端和管理端,用户端应当满足利用者对信息的一站式咨询,需要具有多渠道配置功能、人机交互功能、语言交互功能、实时响应、精准识别和信息推送等功能;管理端应当满足管理者对系统的操作和信息的掌握,需要具有用户信息存储统计功能、无缝人机转换功能、系统个性化设置功能、知识库更新功能等。

从其技术逻辑分析,AI 智能问答的实质是一个从用户提问到机器回答的过程,主要包括两个技术环节,一是对用户提问的处理和理解,二是对用户意图的识别和匹配,技术逻辑参见图1。在用户问句处理环节,系统会自动对用户会话(session)进行切分,对用户问题进行ngram 特征、正则表达式特征、主题模型特征等多维度特征提取,并使用自然语言处理(NLP)技术处理原始问题,通过智能分词、纠错、词嵌入转换等处理,结合特征提取得到的多维度数据,形成用户问题的高维度空间向量表示。用户意图的识别和匹配环节,是使用问题意图识别模型对用户意图进行在线预测,将生成的用户问题高维度空间向量表示输入意图识别模型,进行深度神经网络计算,计算结果输出与标准知识库中知识的匹配概率分布,置信区间对匹配概率判断,达标则预测用户意图,输出答案,未识别则加入问题识别模型,通过在线训练增强模型能力。

图1 AI智能问答系统技术逻辑设计

在智能问答系统中“问题识别模型的构建”和“自主学习”是档案咨询服务智能化与否的两个关键点,“问题识别模型构建”包括训练集构建和问题识别模型生成两个步骤,其训练和学习过程如图2 所示。训练集构建主要是通过对问题领域进行分析,找到种子问题,通过智能分词、NLP技术处理、构建笛卡尔积等,创建初始语料库,再通过人工标注去掉无效语料后形成训练集语料库。问题识别模型生成是结合深度学习的LSTM 和卷积神经网络对训练集语料库进行训练学习,通过构建无人工干涉的评测集对训练结果测评,当测评准确率达到阈值后,模型上线。这一过程可使图1中未识别问题通过反复训练,形成可与标准知识库匹配的意图识别模型,从而准确判断用户意图,输出相应答案。

图2 AI智能问答系统的学习和训练过程

三、AI 智能问答系统在档案咨询服务中的应用

AI 智能问答系统在档案咨询服务中的应用主要是基于档案馆线上服务平台的建立和成熟。目前公共档案馆、高校档案馆等各类档案馆都陆续开设了网站、微信、微博等线上服务平台,并提供相应的宣传、展示、查阅服务。AI 智能问答系统与线上端口结合,既可使用户享受实时的咨询服务,又可与其他线上线下服务相结合,形成一键关联的便捷应用。

档案智能咨询服务应用实例分析——

笔者以西安理工大学档案馆为例,基于档案馆网站平台、微信平台两个线上端口建立智能咨询系统并投入使用。

1.前期准备阶段:笔者通过调研本馆各门类档案咨询中的常见问题,查阅兄弟院校档案馆服务指南、查档指南,随机选取来馆利用者填写问卷三种方式,归纳总结高校档案服务中的常见问题,建立包括学校信息、档案知识、综合业务信息、中英文成绩制作、教学档案、学生档案、党群行政档案、科研档案、基建档案、会计档案、人事档案11 个门类200 余个问题的档案Q&A知识库。

2.搭建及测试阶段:将AI 智能问答系统接入档案馆网站平台及微信平台,在两个平台分别制作可视化标识及咨询界面,将Q&A 知识库导入AI 智能问答系统,从管理端口对问题分类准确性、问题与答案匹配性进行检查,调试无误后上线系统,管理员分别从PC网站端、手机网站端、PC微信端、手机微信端对档案馆智能咨询服务平台进行测试,通过标准问题训练、未识别问题学习、不满意问题纠错来引导机器实现自主训练,进一步优化知识库。

3.使用及反馈:初步测试完成后在网站平台及微信平台向利用者开放智能咨询服务功能,并通过宣传提高该功能使用,笔者以开放后的1 个月、2 个月、3 个月、4 个月为时间节点,对每个月的用户数据进行比较分析,对高频提问进行关联性延展,对未解答问题建入知识库,对无效会话内容进行删除,通过一定时间的使用及逐月训练发现智能问答系统运行稳定,自动应答用户的各类咨询;通过对用户咨询数据的整理积累,初步形成了可以持续复用的档案馆Q&A 知识库;对系统的实际应答效果进行统计分析,机器人直接回复标准答案及引导推荐回复比可达到90%以上;系统自动生成的统计数据可帮助管理者了解回话趋势、咨询热点,及时做好配套服务。

4.服务状况:目前智能咨询系统与我馆的预约查档系统相配合为利用者提供较好的线上服务,尤其在疫情期间保证了基础业务不断档。未来,基于馆藏资源的数字化及智能咨询系统的富文本格式推送答案,智能咨询系统与档案管理系统和资源体系相对接可引导用户实现在线自助查档,极大节约人力,真正实现数据多跑路,利用者少跑路。

通过上述分析研究可见,人工智能技术正在全世界迅猛发展,并将迎来一个崭新的智慧时代。在我国,人工智能技术三次被写入政府工作报告,并作为国家科技战略广泛开发应用。目前各行各业都在积极探索与人工智能技术的结合,导览机器人、文献分类编目机器人、书架巡检机器人等AI技术已经在博物馆、图书馆取得突破性应用。档案工作亦不能落后,要主动把握时代脉搏,在智慧档案馆建设过程中积极利用已经取得应用成果的AI技术,并主动与大数据、物联网、VR等技术融合,尝试将档案智慧化建设由单一环节向多环节、全流程升级,推动档案事业在信息化浪潮中实现跨越式发展。

猜你喜欢
咨询服务知识库档案馆
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
全省部分档案馆新馆掠影
为“一带一路”建设做好咨询服务
高速公路信息系统维护知识库的建立和应用
基于Drupal发布学者知识库关联数据的研究
咨询服务
咨询服务
咨询服务
太仓市数字档案馆成为“全国示范数字档案馆”
when与while档案馆