ChatGPT影响下的人工智能档案服务：突破与挑战

2023-08-19 02:52付永华张文欣司俊勇

档案管理 2023年3期

付永华张文欣司俊勇

关键词：ChatGPT；人工智能；生成技术；多模态；跨模态；自然语言；信息茧房；档案服务

ChatGPT自2022年11 月30日发布以来，以其“高级智能+普式应用”的科技姿态和应用场景，迅速被业界关注，引发各行试用，获得全球热议。作为一款自然语言的处理工具，ChatGPT充分展示了人们想象中的人工智能交互的基本期望：能够真正地理解人们的语言，给出专业的建议和参考，以自然、易懂且流畅的交互方式进行表达，甚至以专业和规范的形式展示。综合各试用人员发布的试用报告，汇集了ChatGPT的49种应用，涉及文本处理、自由交互与专业研讨、图音视频处理与创建、代码和数据库的管理与设计、论文撰写与报告生成，甚至包括情感分析。

有研究者，也与ChatGPT，在档案领域，针对档案基本术语的了解、管理制度的熟悉、具体业务的操作、专业研究的观念、行业领域的发展等问题，进行了较为全面的探讨，发现与其他热门领域一样，ChatGPT对档案也有着深入的认知，并且随着交互人数的增加，这种认知在深度和广度上，都在不断地拓展。这种技术优势，令档案管理人员兴奋不已——可以从本质上提高档案管理和服务的智能化水平，提高效率，提供最满意的服务；但也引发不少人的担忧——档案服务人员，是否不再有用武之地。

《“十四五”全国档案事业发展规划》中，明确指出：人民对档案信息、档案文化的需求日益增长，迫切要求加快档案开放、扩大档案利用、提供优质高效服务。要求加快全面数字转型和智能升级。规划清晰地给出了档案服务创新的背景缘由、美好愿景和迫切期望，也给出了人工智能驱动下，档案服务的发展方向和具体措施。论文也将以规划为核心，剖析ChatGPT技术对档案服务的支撑与驱动，结合人工智能在档案服务中的进展，提出ChatGPT影响下档案服务的突破，梳理ChatGPT等人工智能技术给档案服务带来的风险，为档案智能化服务提供参考。

1 人工智能驱动的档案服务现状

1.1 人工智能驱动的档案服务研究现状。以“创新+档案服务”“信息技术+档案服务”“人工智能+档案服务”分别为主题词，在中国知网数据库分别检索出3436篇、748篇、72篇相关文献。经过梳理，可以得知最近档案服务结合一些技术，包括一些大数据、区块链、机器学习等技术，都为档案服务工作带来很多便捷，也为档案用户和档案工作人员带来诸多便利。

人工智能在档案信息服务领域的应用，赵湘渝[1]提出档案服务结合人工智能，不仅可以帮助档案用户打破空间、时间的限制，更加快捷获取所需要的档案信息资源，并且可以根据用户的档案，分析其特点，为用户推送相关信息。

人工智能的技术应用于档案馆中，使得传统档案馆转型数字档案馆，相关学者胡国强[2]等人提出档案馆依托人工智能技术，既保证了传统档案服务的高效准确，同时也将改革传统的档案馆服务工作。杨靖[3]提出人工智能的技术为智慧档案馆的档案管理、档案服务、用户服务等方面提供了相关技术，这也正是智慧檔案馆“智”的所在之处，同时提出用更多信息技术助力档案馆的建设与发展。

人工智能在档案管理服务的应用中，利用机器学习可以模仿人类的学习行为，深度学习可以通过概念组成结构来表达相关内容，学者张宇[4]提出，基于传统的检索方式，利用机器学习、深度学习等技术可以更快捷地检索音视频档案。

顾伟[5]提出利用神经网络等人工智能的相关技术与算法实现对大量档案数据的管理，可以提出档案的数据特点，实现自动化输入到输出的检索过程。

人工智能在档案开发服务的应用中，学者李霞和冯佳[6]提出目前我国的档案开发服务效率不高，将开发服务引进人工智能技术，通过模块识别、自然语言处理可以更好地开发档案资源，提高档案资源的利用率，提升智慧档案服务建设水平，改变档案开发服务模式，推进档案开发服务工作。

通过以上研究得知，人工智能技术已经逐步进入档案服务工作中，但还是需要结合新技术、新思路，紧密结合时代发展的需要与社会的进步，加深研究方向，用新技术打破传统，实现档案服务新突破。

1.2人工智能驱动的档案服务应用现状。智能整理服务应用。2020年9月，浙江省档案馆与科大讯飞公司，联合开展《人工智能技术在音视频档案整理利用中的应用研究》，利用语音技术和人脸识别技术，对音视频档案进行智能整理。

某地银行开发了金融行业智能档案管理信息系统，可实现智能化数据采集、快速扫描、数据处理等功能。

智能管理服务应用。中国移动通信集团江苏有限公司利用人工智能技术，对档案的保管期限进行自动鉴定；无独有偶，安徽省档案局也利用人工智能技术，开展了此类工作。

智能密集架的广泛运用，推动了无人档案馆的建设，促进了网络档案信息资源智能收集、分类与检索，以及安全管理。

智能审核服务方面。福建省档案馆将人工智能技术，运用到档案开放审核中，设计训练了深度神经网络算法，构建了自动审核模型，实现了自动化审核档案开放工作，提高了审核效率和准确程度。宁波市鄞州区档案馆启用了“可信认证+人脸识别”系统，不用身份证就可以验证用户身份，开启档案服务流程，提升工作效能。

智能安全服务方面。态势感知、人脸识别、步态识别、特征识别等技术，已广泛应用于数字档案馆和档案智慧库房的建设中。利用人工智能技术，对缺损档案、失真档案进行修复优化，也在图像、音视频档案的应用中得到推广，促进了档案的完整性。

2 档案服务视角下的ChatGPT技术剖析

2.1 交互性档案服务技术：自然语言交流。充分、顺畅、和谐的交互，是档案服务质量优良的基础，人工交互对档案服务人员的能力和精力，都提出了极大的要求。传统的聊天交互，通过撷取关键词、拓展关联词、从资料库中寻找应答的方式，进行交互，也有的搭载自然语言处理系统，但受到处理算法的限制，使得当前的智能问答交互，因服务内容的千篇一律和“驴唇不对马嘴”，总是遭受用户的诟病。

ChatGPT首先是一款聊天机器人程序，核心是快速、准确的自然语言处理（NLP）模型，其基本服务是“像人一样自然地聊天”，而目前经测试，基本上做到了这一点，被认为是“有史以来面向公众发布的最好的聊天机器人”

[7]。之所以具备这么优秀的能力，在于基于GPT架构。2018年推出的GPT-1，就具备了基本的泛化能力，可从专业交互拓展的普遍交互；2019年推出的GPT-2，则将重心放到文本生成方面，除涵盖摘要、总结、故事撰写外，在交互上，甚至可以做到多角色扮演，交互内容因用户而异；2020年的GPT-3，参数发生了巨大变化，从之前的十数亿级猛增到千数亿级，在模仿人类交互方面，取得质的突破；2022年1月的Instruct GPT，关注了自然语言交流中的有害、虚假和偏差信息；2022年推出的ChatGPT，则重点关注自然語言交流的输入，能够和用户的意图一致。

2.2 创新性档案服务技术：开放场域的生成技术。提供创新性开放场域的咨询服务，向来是档案服务的核心和努力的方向，也是档案服务的短板。这需要档案服务人员，对专业知识具备较高的专业水准，对生成内容的文本要求，也要达到易懂且流畅。因此，这往往不是档案服务人员的专长。

中国信息通信研究院联合中国人工智能产业发展联盟，对ChatGPT的生成能力展开新一轮评测，包括开放任务和约束任务。经测试发现，在创意写作方面，评分最高，尤其是学术类创意，生成内容的可读性、创造性、专业性、连贯性较强；在格式拟定命题写作中，对设定字数、修辞、体裁等约束表现优秀；在学术类摘要生成中，对相关性、创造性、专业性等约束表现优异。

之所以具备这样的能力，在于C h a t G P T 采用了Transformer模型[8]。传统的算法模型，一般采取人工标注数据的方式，虽然准确率比较高，但导致数据量比较少，无法面对庞大的档案数据处理，更使得学习训练的周期太长，智能成长太慢。Transformer模型重点关注了人脑的学习过程，将人类的反馈信息作为学习对象，不需要累积和重复，可以面对大量数据，从而提高学习速度和质量，尤其是拓展到其他任务中。

2.3 呈现性档案服务技术：多模态跨模态。档案服务的最终结果，还是要呈现给用户。ChatGPT构建了多模态模型，可以呈现给用户不同的模态，甚至可以实现模态的转化，体现在具体的技术上，则面向三个方面：数字孪生、智能编辑和智能创作[9]。

ChatGPT的数字孪生，重点体现在效果增强和形式呈现方面，效果增强可以实现模态在呈现过程中产生的信息损失和偏差[10]，让效果尽可能达到用户满意，形式呈现则负责沟通数字档案和现实世界，因此，ChatGPT以“写实力”，改变了“元宇宙”的虚拟构境，让虚拟现实变得更加务实。编辑能力则允许用户继续创作，让结果更符合用户的要求，而这种继续将被保留下来，作为用户偏好采集和柔性改进的依据。创作能力则保障呈现的内容，不仅仅是文字的原创，更是概念性的创作，给人们以启发。

2.4 开放性档案服务技术：涵盖广支持多。早在二十世纪八十年代，就开展了关于档案开放性服务的探讨，也有不少档案管理部门，相继出台了开放性的服务，红色档案、历史档案、精神挖掘、城市传承……各种开放服务模式和方式相继涌现，取得了一定的成果，但整体上依然处于“曲高和寡”的状态，感兴趣者不多。

ChatGPT构建了涵盖广的框架，包括GPU（英伟达）和TPU（谷歌）等加速芯片的支持的基础硬件层，还有涵盖云计算平台层、模型层和应用层。另外，在应用层面，上中下游均呈现强力支持局面：数据、算法、底层工具，形成良好创新生态；文字、图像、音视频动画处理企业如雨后春笋涌现；各内容创作、发布和服务平台林立。这些均为开放性档案服务提供了良好且广泛的基础。

3 人工智能驱动的档案服务突破

ChatGPT只是人工智能众多产品之一。实际上，作为二十世末到现在，稳坐三大尖端技术之一的人工智能，涉及的技术非常多，主要包括智能视觉技术、机器学习技术、自然语言处理技术、生物识别技术和机器人技术等。

3.1 检索服务突破：所行所得、所想所得。检索服务是档案基本服务的基础，但是，无论是通过树状结构以此精准“点开”，还是通过关键词匹配，都需要一定的专业素养。事实上，对个人要检索档案的清醒认知、对检索方式和检索关键词的准确表达、对检索结果的反馈方式，往往很难统一，达到一致。

在自然语言处理、机器学习、智能识别驱动下，系统能够充分地理解用户输入的检索词，所表达的含义，一方面，是因为系统熟悉了用户的表达方式，对输入的内容进行了规范的处理，另一方面，通过历史记录、操作行为、浏览痕迹和关联业务等信息，对用户的检索目的进行了预期分析。因此，用户使用系统的次数越多，时间越少，用户的检索目的就越清晰，检索速度就越快，准确程度就越高。对于刚开始使用系统的用户，也将通过用户身份验证和关联系统操作等数据，共享其他用户的“行为+想法”，使得初次启动使用变成“温启动”甚至“热启动”。

3.2 交互服务突破：自然流畅、多模呈现。不管是何种档案服务，最终都需要与用户进行交互。当前档案服务过程中，交互应用场景一般包括：档案系统专业检索交互场景、普式档案平台范式搜索交互场景、档案内容浏览交互场景、档案需求反馈交互场景、档案决策咨询交互场景、约束性档案文本处理交互场景等。这些交互场景，目前整体略显呆板，与用户交互的流畅度不够。

人工智能驱动的档案交互服务，细分交互场景，充分考虑实时交互和非实时交互。实时交互可用于档案客服问答、非专业性档案咨询方面，非实时交互则考虑结构化交互和开放性交互。在内容确定的情况下，除了以文本的形式展示之外，呈现多种模态：将文本转化成音频，同时可包含情感，甚至实现语音克隆，以用户喜欢的声音交互；将内容变成图片，富含结构化和逻辑性，甚至还充分考虑美观；生成多种档案服务策略，可供用户选择最适合自己的服务策略；以虚拟人的形式出现，通过表情、声音、肢体行为和语言，生动形象地与用户进行交互。

3.3 知识服务突破：创新挖掘、千用千面。知识服务是深层次的档案服务，综述研究，主要内容包括：基于档案，可提供何种知识服务；知识服务模式有哪些；可融合何种智能技术来提供知识服务。有两个观点值得认可：知识服务应该是一种创新性的服务；知识服务以用户的需求为目标。当前的主要知识服务模式，还是充分依赖档案工作者的智慧，当然，有众多表现形式，例如构建档案知识服务智库等，均没有充分意识到人工智能对知识服务的驱动作用。

在知识服务领域，人工智能的优势体现在对原始档案的深度挖掘方面，而且是创新性的挖掘。比如，利用知识图谱可实现新知识的抽取，尤其是面对非结构化数据，更具有优势。而即使是富有经验的专家，在面对大量非结构化数据时，也将产生无力感。同时，基于档案的知识服务，往往会提供一些较为准确规范条件和模板，这对善于学习的人工智能来说，更是易如反掌。而且，根据不同的需求，面对相同的档案，可提供不同内容、形式的服務，实现千用千面。例如，面对一份人事档案，研判其承担某研究项目的能力和管理某部门的能力，将形成不同的建议报告。

3.4 组织服务突破：自组自调、动态融合。档案分类是档案组织的重要工作，层次清晰、结构合理的档案分类体系，是档案良好应用的基础。但是，随着档案数字化、电子文件的快速推进，以及新载体、多媒体的出现，导致大量非结构化档案本体数据快速涌现，这更对档案的组织提出了挑战。在人工智能的驱动下，档案的组织问题，正向着自组自调模式发展，根据不同的需求，产生动态融合，减少大量的人工分类和标准，而且能够发现、发掘各档案之间的内在联系，支撑更多智能应用。例如，在工程档案方面，构建即时决策机制，动态调用历史库、问题库，对当前施工效果进行预判，并给出优化建议。

3.5 安全服务突破：主体完整、使用保障。档案安全作为国家安全体系的重要组成部分，是档案工作的底线和红线。档案的安全其实主要包括两个方面：主体的安全和使用的安全。在主体安全方面，主要是完整性，通过人工智能，分析主体的采集是否规范，是否有遗漏，充分体现其在真实性、有效性方面的作用；对档案价值进行评估，及时准确更新安全防护等级；机器学习可分析安全漏洞，主动消除安全隐患，并进行预警。在使用安全方面，主要是保障，则充分运用生物识别技术，确保档案在使用过程中，专人使用、按规使用，对有意或无意造成的档案泄露，建立可追踪机制。

3.6 情感服务突破：解忧除难、全程暖心。关于人机情感的发展，学者略有分歧，观点有三：一、人机情感是人工智能的分支；二、人机情感和人工智能是发展的不同方向；三、人机情感是人工智能的下一个发展阶段。但毋庸置疑，人机情感受到的关注程度越来越高。

人机情感技术驱动的档案服务，将充分识别用户的焦虑程度，优先将数据资源尤其是计算资源，分配给急迫程度更高的用户，并且能够跟踪持续性问题，剖析真实需求。通过音视频情感特征分析，分析用户对档案服务结果的理解现状，主动优化呈现形式。例如，两个大学生同时搜索郑州某建筑的档案，将根据操作行为和阅读行为，分析结果匹配程度和理解能力，给出提示。对历史档案服务，也将随着人工智能学习的不断更新提升，在发现内容和以往服务不符合或有更新时，主动提供更正和追加。

4 人工智能驱动的档案服务挑战

4.1 性格泄露。简单的用户隐私主要是指用户身份信息，这并不足为惧。然而，为了提高档案服务质量，人工智能驱动下的档案服务通过各种硬件软件，全面记录了用户使用档案时的物理空间和网络空间，充溢于档案工作全流程，并全面存档用户档案服务的历史记录、操作行为、浏览痕迹和关联业务，从而促使人工智能成为最“懂”用户的角色，自然能够洞悉用户的行为、偏好、性格等。基于非结构数据整合、未知关系分析的用户“行为画像”和“性格画像”功能[11 ]，研判用户正在接受的档案服务工作，分析用户的喜好志趣，揭露用户的性格缺陷，甚至有可能将某些保密工作毫无保留地展示在人工智能面前，实际上也是暴露在人工智能产品所属企业眼前，这才是令人们心生担忧的问题所在。

4.2 服务偏差。和人类一样，人工智能提供的档案服务，源于学习和训练。通过模仿人类的持续学习和信息反馈，依靠庞大的数据，融合各种信息呈现技术，借助不同用户长期使用的反馈调节，从而促使人工智能可以提供各种模态、形式多样、内容丰富、具备原创的档案服务。然而，人工智能在档案服务过程中由于缺少主动性思考，因而无法避免错误的产生。根据目前的研究和应用，人工智能出现服务偏差甚至错误的情况屡见不鲜，例如：如果用户缺少对人工智能所提供服务的慎重研判，忽略档案服务建议的可行性思考与合理性分析，极有可能给工作带来隐患甚至产生损失[12] ；人工智能在进行知识服务时，善于解答开放性的问题，而档案服务工作在应用于不同的档案类别时，需要面临多领域的知识条件性约束，因此档案服务是一项经验趋向性强的工作，而这将会成为制约人工智能进行档案服务的障碍之一。

4.3 技术崇拜。人工智能技术的快速发展，使其广泛应用于各个领域并取得了令人瞩目的成就。尽管人工智能提高了工作效率和准确度，但也容易导致人们盲目地推崇技术，产生唯技术论的思想，从而缺乏学习的进取心。在档案服务工作中，由于人工智能缺少主观能动性，只能实现简单、重复的档案工作，无法真正实现离开档案工作人员的决策性服务。同时，人工智能在档案领域的广泛应用将会导致档案教育无足轻重的错误理念，档案教育对于档案服务工作而言至关重要，其能够启发档案开发利用的意识和能力，挖掘档案服务利用价值，因此人们应当注重档案服务中人工智能的合理运用。

4.4 信息茧房。按道理来说，人工智能可以促进人们对信息的了解，从而更加全面地获取信息。但实际上，人工智能恰恰是信息茧房的最大制造者。通过记录分析用户的爱好，利用文本生成技术，大量生成和推送用户喜好的信息，营造出一个用户感兴趣的虚拟世界，让用户觉得现实生活就是如此的假象；或者让用户认为自身的理解和认知果然是正确的，因为用户的信息感知仅限于此。在档案服务工作中，这将导致用户的爱好不断地受人工智能有限档案服务的影响从而巩固加深，而人工智能并不负责判断这些信息的准确性，因为这是用户所喜欢的信息内容。所以从这个方面来讲，人工智能在有些时候限制了人们创造力的发展。

4.5 价值引导。某些档案服务，可能对用户的价值观、世界观认知存在一定的关联和影响。例如，城市记忆档案的历史传承、红色档案的革命精神挖掘、工程工艺档案的工匠精神洗礼等，都能够对人们的价值观产生积极的影响。然而，人工智能无法很好地适用于此类档案服务工作。同时，尽管技术是无国界的，但技术企业和掌握技术的人是有国界的。在档案服务过程中，除了正确性因素之外，答案是否有一定的价值倾向引导，值得警惕。