大数据技术背景下民间文献的精准研判路径

2020-12-07 05:56崔超
兰台世界 2020年11期
关键词:大数据技术

摘 要 史料是史學研究的根本基础与直接来源,无论“地上”史料还是“地下”史料,都具有史料不可回避的问题,即真假可信度及其精准研判路径。民间文献作为特殊史料,具有不同于官方史料的变动性、调适性及不确定性,给以民间文献为研究中心的范式带来极大的困惑和混沌,必须采取各种技术手段精准研判民间文献史料的“三性”,即合法性、客观性和关联性。日新月异发展的大数据技术为精准研判民间文献带来新思维、新技术和新方法。

关键词 大数据技术 民间文献 精准研判 具体路径

中图分类号 G270.7 文献标识码 A 收稿日期 2020-03-15

★基金项目:2018年度教育部人文社会科学研究青年基金西部和边疆地区项目“明清以来湘黔桂多民族互嵌地区的开发治理及族群互动研究”(项目编号:18XJC770010);2019年度贵州中医药大学博士启动基金项目“清代贵州苗疆司法制度研究”(项目编号:[2019]111号)。

★作者简介:崔超,贵州中医药大学人文与管理学院副教授,贵州省中医药(民族医药)产业发展研究中心研究员,法学博士,兼职律师,兼职调解员,研究方向为中国法律史。

Abstract Historical materials are the fundamental basis and direct source of historical research. Both "on-the-ground" historical materials and "underground" historical materials have unavoidable problems, that is, authenticity credibility and accurate research and judgment path. As a special historical material, folk literature, different from official historical materials in terms of variability, adaptability and uncertainty, brings great confusion and chaos to the paradigm of folk literature as the research center. It is more than necessary to adopt various technical means to accurately study and judge the "three characteristics" of folk literature historical materials, namely, legitimacy, objectivity and relevance. The rapid development of big data technology brings new thinking, new technology and new methods for the accurate study and judgment of folk literature.

Keyword big data technology; folk literature; accurate study and judgment; concrete path

2011年6月,全球知名的咨询公司麦肯锡最早指出大数据时代的来临,并认为“数据已经渗透到每一个行业和业务领域,成为重要的组成部分之一”[1]3。近年来,史学界正探究运用大数据技术于史料的研判之中,由于学界在研究各级各类民间历史文献技术方法领域还存在诸多难点、痛点、盲点和疑点,加上各种地方档案和民族志的缺失不足,使得官府史料与民间史料的互证互印功能大打折扣,要确保民间文献具有证据的“三性”,须运用大数据技术,立足民间文献的方法理念、方法思维、方法逻辑、方法技能和方法步骤,不断探索和积极发掘大数据时代民间文献精准的搜集、汇总、研判与应用。

一、大数据技术契合民间文献的机遇

1.有效扩大民间文献占有。史料是史学研究的根本基础,民间文献是史学研究的重要证据。学者研究若没有史料,就好比“无本之木”“无源之流”,再优秀的学者没有史料,也无法解决“巧妇难为无米之炊”的困境。传统史料获取渠道各有所长所短,其痛点在于没有实现史料资源与虚拟资源的互联互通,没有形成线上资源与线下资源的共享共用。大数据技术可弥合二者之间的不足,实现史料来源在现实资源与虚拟资源上的无缝对接,促进开发史料资源与数据资源的有效结合。一方面,大数据技术通过分布式互联网方法与云存储手段,深入开发、挖掘出特定问题与个体史料的互联数据库,既承载表达史料的基本情况、归属领域、精准程度、典型案例等主体信息,又收集、存储、传输与之相匹配的史料,实现民间史料的稳定增长,促进民间史料恰如其分地与最适合的问题与使用者有机配对;另一方面,大数据技术能整合民间文献来源的诸种传统渠道,实现民间文献渠道资源有机衔接,对各种民间文献产生主体、传播主体、使用主体等基础信息有序建立史料数据库,并在方法上设置特定数据空间,满足不同主体对民间文献在采集、存储、使用、汇集、完善等方面的诸多诉求,形成双向数据信息沟通表达机制,并且通过数据分析各种使用民间文献主体所需史料来源、史料形式、史料概况、史料准度、史料瑕疵等诸多信息,使学界和学者能快速有针对性地给予民间文献恰如其分的关心、认知、采用,凸显维护民间文献产生主体、权利主体和使用主体的积极形象,达到成功获取民间文献的结果,既能保留民间文献存量,又能增加民间文献增量。

2.精准掌握民间文献信息。21世纪是信息社会,更是数据社会,信息和数据已成为各行各业各体生存发展的重要基础资源,人类社会每天都会产生和使用大量信息数据。据日本IBM公司统计,到2020年,全球会生成数据35ZB,相当于2009年的44倍[2]8。史学研究既要依托大量民间文献信息数据资源,例如瀚如烟海的契约、碑刻、家谱、族规、摩崖、石刻,又要处理大量民间文献信息数据资源,例如确定民间文献的择取方向,甄别民间文献的真伪对错,处理民间文献的存疑讹误,考量民间文献的证明程度,梳理民间文献的沿革线索。若仅依靠传统文献信息检索方法,以查字典的方式检索文献信息,显然已不适合大数据时代史学研究的方法要求。大数据技术能为学界收集、整理、鉴别、研判、使用民间文献及信息数据创造诸多便利,一方面是可以通过相关数据库迅速有效地寻找主体所需的各种民间文献信息数据资源,例如中国裁判文书网、北大法宝、北大法意、Westlaw Next、Hein Online等中外文数据库;另一方面是可以根据主体自身掌握的民间文献信息数据资源构建DIY数据库,即地域性或专题性民间文献数据库,以方便学界在研究中及时检索、获取、分析、处理所涉问题的“地方性知识”。众所周知,人脑主要依托经验方法,电脑主要依托数字方法,通过大数据的逻辑方法和技术方法,能够将各种民间文献数字化、电子化与集成化,按照各学科学术研究的特点与需求,搭建各种符合学科需要的数据库,全面、系统、科学、优化、高效、持续地形成民间文献数据库,有的放矢地处置各种研究素材,事半功倍地完成各种文献研究。

3.丰富选取民间文献方法。数据参与史学研究方兴未艾,速度快,影响大,效率高。一方面,运用大数据方法将纸质版民间文献转化为电子版数据材料。通过检索关键词高效捕获主要信息和关键细节,保证民间文献的真实性,提高史料运用的效率。通过数据化民间文献,节省大量人力、物力和财力,使学界能够把研究时间和研究精力聚焦到问题的关键点、争议点和突破点上。通过民间文献数据库,发掘与学术研究相似或近似的判例、数据、典故、事件、沿革等细节信息,深度梳理民间文献研究所涉主要史实与关键细节。通过电子数据方法,尤其是云计算分析法,识别出研究中民间文献的真伪程度与研判民间文献的证明力度。通过综合分析数据化民间文献,将大量的文字、图片、信息转换为数据链条,最大效率、最大领域、最大方位呈现民间文献的链条体系,避免民间文献使用出现盲人摸象和一叶障目的困境。另一方面,运用大数据技术思维与逻辑方法构建民间文献研究新方法。通过视频直播或延迟技术,构建国内外高校、科研机构、研究者互联交际系统,随时实现各方主体会诊民间文献,尤其是方便各主体对疑、难、杂、病的民间文献进行实时沟通互动。通过大数据技术,充分利用云计算、物联网,开发档案馆、博物馆、图书馆、高校、科研机构、民间文化人、研究学者等主体构成的互动平台与史料工程,“让数据多跑路”。通过大数据的演算方法与公开演示,切实简化民间文献研究方法的困境与羁绊,以确保民间文献资源依法开放传递,实现民间文献资源共享共治。通过大数据交互方法,充分利用各种传感器在民间文献中的建立与运用,依法构建各种民间文献“天眼”,不断收集数据资源,不断保护数据资源,不断运用数据资源,促进民间文献人机互动与人际交流。

二、大数据技术冲击民间文献的表现

1.民间文献理念不断更新。大数据技术正不断更新包含民间文献在内的史料理念,史学界、法学界、民族学界、人类学界都须与时俱进地紧跟大数据技术步伐,否则,“逆水行舟,不进则退”。囿于我国民间文献在研究队伍、研究理念、研究技术、研究结构、研究方法等综合因素方面存在一定差异,导致学界对民间文献与大数据技术关系的认识参差不齐,“马太效应”逐步显现。有的学者已开始思考大数据技术背景下民间文献的方法变革,认为大数据不仅带来新的史学研究范式,还提供新的史学研究方法和研究思维[3]151。有的学者还沉寂于民间文献的方法窠臼。目前,大数据技术已涵盖诸多领域,基于大数据、云计算、物联网的史料概念、性质、分类、地位、功能等难以界定,日趋模糊,边际效应突出。例如,民间文献在网络平台上的使用传播行为界定,一定程度上给理论界和实务界带来诸多困惑,其行为是否构成侵犯著作权还存有争议。又如民间文献能否在大数据技术中进行交易,其合同关系如何识别、如何规范、如何维权。再如一旦民间文献通过大数据技术进入公开领域,其文献档案的概念界定、价值衡量、内容精准、功能大小、对错评判等实体与程序问题由谁界定、由谁实施、由谁裁判均存在现实困境。

2.民间文献知识不断提高。科学技术是第一生产力,以大数据引领的新科技革命更加需要知识、人才、劳动、创造。诸多需要都离不开技术知识,技术是解读万事万物的钥匙,而技术知识则是把握这把解密钥匙方向与准度的关键。“秀才不出门,尽知天下事”的时代早已到来,一个通信设备、一个网络、一个电源就可覆盖“地球村”,世界日益变小,事务日益繁多,人际交往扩大,生活节奏加快,心理负荷增压,无不对现代人提出更高的技术知识要求。苦坐书斋、学习古籍、求学问道的史学界不仅应具备更加完善的知识体系和更加健全的探究技术,而且应具备不断学习、不断革新、不断探索的民间文献创生方法。否则,无法胜任日益繁重、形态多样、问题不少的新史料、新史观、新史学,更难以担负采集、汇编、开发、使用、验证、保存民间文献的学术使命。大数据技术对民间文献提出更高的技术方法要求。首先,民间文献方法知识必须面对加快更新的史料体系,必须面对日益繁多的史学理论,必须面对综合立体的史学知识。其次,民间文献方法知识必须应对大数据、互联网、物联网、云计算、电子商务、网络计算机、物流、通信工程、环境监测评价等诸多自然科学知识与跨学科交叉知识的冲击。最后,民间文献方法知识必须应对民间文献固有的不确定性、不充分性与不精準性的困境袭扰。

3.民间文献技能不断升华。不少研究者总认为自己经过多年学术研究实践,已熟练掌握民间文献技能方法素养,不需花费大量的时间和精力升华自身技术方法。其实,知识时代、信息时代和数据时代,知识与技能的更新周期不断缩小,过去几百年更新一次,到现代便是三五年更新一次,甚至有一年一更新的趋势,现代社会爆发式的知识更新速度要求民间文献技术方法破除“经验主义”的狭隘错误。大数据Velocity(高速)特性,对由大数据主导的新科技革命,对由大数据渗透的各行各业,对由大数据发起的史学研究带来诸多挑战,特别是大数据的高速特质必然对民间文献技能更新提出更加严苛的要求,墨守成规的传统民间文献方法技能已成过去时,日新月异的新型民间文献技能模式成为现在时。例如,传统民间文献在寻求史料方面,主要采用书籍查阅、实地考察、座谈交流等技能,如果不能及时跟进大数据引领的高新技术产业,不会使用微信、微博、微视等新媒体技术和若干手机APP智能软件,那么此类民间方法技能只会出现守株待兔式的悲剧结果。又如传统民间文献技能在利用过程中往往采用纸质阅读法,无暇采用电子录入存储与电子阅卷分析法,更不会运用大数据的信息处理与数据分析方法,将大量的时间花费在纸质阅读上,却无法检索民间文献的某一个关键词或细节问题。再如传统民间文献技能在调查取证工作中,往往要求当事者提供材料来源的证据,而自己懈怠于实地调取,致使或因遗漏民间文献,或因民间文献收集缺漏,或因民间文献论证瑕疵,而导致民间文献使用成功率大打折扣。

三、大数据技术完善民间文献的路径

1.建立民间文献数据库。“工欲善其事,必先利其器。”大数据技术时代的民间文献,必须首先做好民间文献的革故鼎新,充分运用大数据于民间文献中,构建民间文献数据库。数据库建设是人工智能建设的基础,任何一个人工智能的发展都离不开海量数据的辅助[4]122。该数据库大致包括民间文献的基础数据、来源数据、沿革数据、案例数据、文书数据、统计数据、行业数据、文件数据、方法数据、实物数据等子库。通过各级各类民间文献的数据库,既能构建民间文献内部交流平台,又能构建学者同行交流平台,还能构建民间文献学术交流平台,以实现发掘学界内部民间文献资源,向同行同业同事相互学习民间文献史料,邀请专家学者主讲民间文献知识等平台功能。

2.保护民间文献著作权。著作权是作者对自己创作的作品依法享有的权利。根据《著作权法》第三条的规定,民间文献无论是口述传承,还是文字叙述,作者对其均享有著作权。根据《著作权法》第二十条和第二十一条的规定,作者享有的著作权包括著作人身权和著作财产权,著作人身权实行永久保护,著作财产权保护期为作者终生及其死亡后五十年,著作人身权不具有继承性,但著作财产权具有继承性。对于近现代的民间文献,其作者享有的著作权比较容易得到法律确定和法律保护,应给予充分尊重和保护,一方面保护民间文献的著作人身权,即署名权、修改权、发表权和保护作品完整权;另一方面在行使民间文献的著作财产权时,要依法使用和尊重保护复制权、发行权、出租权、展览权、表演权、放映权、广播权、信息网络传播权、摄制权、改编权、翻译权、汇编权及应当由著作權人享有的其他权利。

3.搭建民间文献区块链。区块链是当下与大数据并肩的流行词汇,是一种结合对等网络(P2P)技术和加密技术而创造出不可更改的分布式可验证公共数据库的数字技术,广泛运用在艺术、法律、开发、房地产、物联网、保险、金融等诸多行业[5]75。就民间文献而言,除探索运用区块链所具有的分布式数据存储、点对点传输、加密算法等计算机技术来构建民间文献的数据库外,还可将区块链所意蕴的“去中心化”“共识制度”“激励机制”融入大数据时代民间文献的创新与变革中。民间文献的“去中心化”是指要破除传统民间文献中的惯性思维、经验主义和陈旧方法,在民间文献的思维上树立数据意识、信息意识、虚拟意识,在民间文献的实施上注重实证研究、场景还原和数据构建,在民间文献的评价上强调电子化、数据化与技术化。民间文献的“共识制度”是指史学理论界与实务界要达成共识,逐步构建我国民间文献的方法理论体系与实务经验总结。民间文献的“激励机制”是指在学术队伍中制定构建大数据民间文献的激励机制,通过政策支持、经济补助、精神鼓励来促进史学研究者不仅注重民间文献方法的构建意识,且切实形成具有大数据时代背景的民间文献数据信息资源体系。

总之,以大数据技术为基础要素的人工智能不仅深刻地影响到史学的理论与实践,且引发历史文献诸多领域的改革和反思,在大数据技术引领的大变革时代,史学界必须未雨绸缪,统筹兼顾,做好民间文献的理论建立,谋求民间文献的优化重组,实现民间文献的革故鼎新,应对民间文献的机遇挑战。

参考文献

[1]于福志.大数据时代[M].长春:吉林文史出版社,2017.

[2]大河原克行,苏小楠,栗烨.图解大数据[M].海口:南方出版社,2015.

[3]梁仁志.大数据:作为史学研究的一种基本方法[J].南京社会科学,2019(6).

[4]程凡卿.我国司法人工智能建设的问题与应对[J].东方法学,2018(3).

[5]郑戈.区块链与未来法治[J].东方法学,2018(3).

猜你喜欢
大数据技术
善用“互联网+” 提升政府善治能力
大数据技术之一“数据标识”
基于大数据技术的O2O跨境电商客户信息研究
大数据技术在雾霾治理中的应用
浅谈大数据技术在互联网金融中的应用
大数据技术在电子商务中的应用
大数据技术对新闻业务的影响研究
大数据技术在电气工程中的应用探讨
大数据技术在商业银行中的应用分析