开源基础设施、“影人个体数据库”与数字人文知识生产
——基于中国电影知识体系平台的考察

2024-04-03 04:35檀秋文
山东社会科学 2024年1期
关键词:影人年谱开源

檀秋文

自2019年起,关于编纂中国电影人年谱的呼声在学术界渐渐兴起。以北京大学李道新教授为首的团队在此领域进行了大量的先行探索。(1)相关成果有李道新:《影人年谱与中国电影史研究》,《当代电影》2019年第1期;普泽南:《从数字人文的起源看影人年谱与其关系》,《电影艺术》2020年第4期;李道新:《数字人文、影人年谱与电影研究新路径》,《电影艺术》2020年第5期;李鹤伊:《数字人文、文化分析与中国影人年谱的可视化》,《郑州大学学报(哲学社会科学版)》2021年第5期;乔宁:《数字人文时代基于社会网络分析法的影人年谱研究初探》,《电影评介》2022年第2期;徐之波:《拟形化历史与结构化知识:数字人文视野下影人年谱研究》,《电影评介》2023年第1期;谭文鑫:《以费穆为例谈影人年谱的编纂策略》,《当代电影》2023年第6期。编纂影人年谱对于电影学界来说尚显新鲜,但是“中国的年谱和年谱学,从宋代初兴,到清代极盛,再从近现代梁启超、胡适的大力倡导,到当下文史学界部分学者的身体力行,均为人物研究及其历史书写奠定了较为坚实的基础”(2)李道新:《影人年谱与中国电影史研究》,《当代电影》2019年第1期。。应该说,中国传统史学深厚的年谱传统和丰富的实践经验,使得中国影人年谱的编纂及相关研究从一开始就能从中汲取丰富的滋养,少走很多弯路。

在此前关于中国影人年谱的研究中,多探讨年谱编纂的意义、对中国电影史研究的启发,并尝试将影人年谱编纂与数字人文方法相结合,以期为中国电影史研究开拓新的视野。然而,前述研究还都是在电影史学乃至电影学的范畴内讨论影人年谱编纂的意义,且忽视了一个根本前提——数字时代影人年谱编纂所具有的不同特点,以及相关数字基础设施建设的重要性。同时,由于缺乏具体的影人年谱文本和编纂实践(虽然有一些影人横跨电影、文学及其他多个领域,例如夏衍等,他们的相关年谱已有多个版本,但由于谱主的活动不局限于电影界,因此本文不予讨论),这些研究只能停留在理论层面。

随着社会的高速发展,大数据、云计算、人工智能、区块链、移动互联网、5G等迅猛发展,数字技术以前所未有的势头改变着我们工作和生活的方方面面。各种数字化基础设施建设被提上日程,其重要性不言而喻。由于一切信息、数据在互联网上的生产、存储和流动都需要相应的设备和技术结构,因此,互联网平台也可被视为数字时代的基础设施,有学者将其称为“物质基底”(3)束开荣:《互联网基础设施:技术实践与话语建构的双重向度——以媒介物质性为视角的个案研究》,《新闻记者》2021年第2期。。数字时代的信息获取,除了如往常一样要求信息的准确性,还对所获信息的丰富性和信息获取的便捷性提出了更高的要求。这一数字时代信息传播的新特征也要求影人年谱的编纂探索新的存在形态,实现数字化转型。而实现这一转型的前提,就是构建新型数字基础设施。

近年来,北京大学艺术学院和中国传媒大学文化大数据实验室联合开发的中国电影知识体系平台(Chinese Cinema Knowledge System,以下简称“CCKS平台”)上线,影人年谱终于有了可供展示的窗口。目前,在CCKS平台上,诸如费穆年谱、史东山年谱等都已初具雏形。后续研究也终于可以有的放矢,学者们能够结合其在数字平台上进行编纂和展示的具体实践,对数字时代影人年谱的功能、特点、影响等展开进一步讨论,避免了凌空蹈虚的尴尬。基于此,本文尝试从数字平台开源基础设施、“影人个体数据库”、数字人文知识生产等角度来探讨依托数字平台进行影人年谱编纂和开展数字人文研究的可能性和可行性。(4)需要指出的是,CCKS平台上还有“电影计量”“知识生成”“电影百科”“文献索引”等版块,但是“影人年谱”是其中最特殊的一项,因此本文将集中探讨数字平台与影人年谱的关系。

一、开源数字基础设施与“影人个体数据库”

在《中国电影史学述要(1978—2019)》一书中,笔者曾经倡议建构中国电影史料数据库。(5)参见檀秋文:《中国电影史学述要(1978—2019)》,人民出版社2020年版,第214页。这是因为,在大数据和信息化时代,各种数据库的出现使史料搜集的困难情况大大改观。如此一来,如何在海量资料当中迅速找到自己所需的内容,就成了当下学者们面对的幸福的烦恼。因此,树立以资料集成与数据库建设为重点的新史料观,并以此为基础建设中国电影史料数据库,是一条可行的路径。

需要注意的是,在文学、历史学等领域,相关数据库基础设施的搭建已经非常成熟,诸如“中国历史地理信息系统”“丝绸之路历史地理信息开放平台”“中国历代人物传记资料库”“学术地图发布平台”“中国基本古籍库”“中国历代典籍总目分析系统”“智慧古籍平台”“抗日战争与近代中日关系文献数据平台”等数据库的出现,极大地促进了各自学科以及相邻学科的研究,并发挥着越来越重要的基础作用。在电影学科,国内外目前也已经出现了若干类似的数据库,CCKS平台上就提供了47家国内外相关电影数字平台的链接。然而,在中国内地电影学界,尚未出现对学术研究具有基础性作用的数据库。曾经被寄予厚望的“中国电影学术网”“中国电影人口述历史数据库”等,都因为种种原因,尚未达到此前的期待目标。

有研究者指出:“在媒介基础设施视域下,如何祛蔽除魅、破除封闭化、固态化和私有化的‘蚕茧’?其理想蓝图是以‘开源’方式所带来的‘超级共享’。”(6)黄颖、申国敏:《单景茧房、液态环境与开源未来——媒介基础设施视域下的影像传播特征初探》,《当代电影》2021年第11期。CCKS平台的介绍中称该平台是“在知识论与知识管理学的框架里搭建的一个众包群智、开源共享的,具有思辨性、成长性的中国电影数字基础设施”(7)李道新:《“中国电影知识体系平台”简介》,https://movie.yingshinet.com/#/introduction,访问日期:2022年7月9日。。其中,“众包群智、开源共享”体现了该平台的特点。在全球化时代,“如果说收集数据是一种意识,使用数据是一种文化、一种习惯,那是否开放数据则是一种态度”(8)涂子沛:《大数据》,广西师范大学出版社2013年版,第332页。。在这种背景下,CCKS平台上的数据面向所有人免费开放,无需注册账号就可以浏览网站的所有内容(9)当然,如果想上传包括影人年谱在内的相关数据,那么就需要注册账号,管理员通过后即可录入。,无疑顺应了信息、资料和数据开放共享的潮流。更为重要的是,“开源,不仅意味着以开放的姿态进行知识共享,还代表着自由、平等、协作、责任和乐趣等等理念”(10)涂子沛:《大数据》,广西师范大学出版社2013年版,第189页。。平台的开源将会使这些理念逐步深入人心,成为学界共识,从而促进学术民主,营造良好的学术生态。

依托开源数字平台的影人年谱,具有与传统编纂形式不同的形态。传统年谱只能以单一的纸质版本(文字加图片)呈现,即便有录音、录像文本,其与纸质版本也处于相互割裂的状态,难以产生联系,“但数字存储接近于零的低成本、数字设备的小型化和个性化、带宽和网络基础设施的扩展,加上一种强烈的复原和再现的欲望,已经为各种档案的复活创造了前所未有的有利条件”(11)[美]约翰·杜海姆·彼得斯:《奇云:媒介即存有》,邓建国译,复旦大学出版社2020年版,第346页。。在数字平台上,完全可以将与影人相关的文字、图片、录音、录像等各种文本统一集成,以多媒体的方式呈现。传统形式的年谱编纂完成之后,如果发现错误或者遗漏想要进行改动,那么就需要投入大量的时间、经费,一时难以完成。数字平台则不同,只需要在后台对信息进行增删、修改即可,成本几乎可以忽略不计。并且,数字平台上的信息在理论上可以无限期补充、随时更新,其便利性是传统年谱完全无法比拟的。

作为一种数字基础设施,CCKS平台之于影人年谱的作用,是将以往有形的、物质的传统呈现方式,转变成网络上无形的、虚拟的展示,这样就可以跨越时空和物理的障碍,保存尽可能多的信息和资料。每个人的生命都有穷尽之时,但是其生命经历在数字平台上可以永久存储和展现。因此,影人年谱的最终发展方向,可以是依托CCKS这一平台建立起“影人个体数据库”。

“影人个体数据库”的建构需要立足于前人所做的工作,并与其他相关数据库密切联系。数字技术的发展,使得各种史料能够以数字化形式呈现,给学术研究带来了极大的便捷。时至今日,通过数据库检索来辅助研究已是普遍行为。以史东山研究为例,前人对史东山的研究多依赖《史东山影存》(中国电影出版社2003年版),该书是当时条件下能够编纂出的最高水平的相关文献。然而,笔者经过在“民国时期期刊全文数据库(1911—1949)”“《申报》数据库”“《大公报》数据库”等不同数据库中反复检索,查找到的相关文献数量之多、内容之丰富,远远超出《史东山影存》所涵盖的范围。在这些新检索出来的文献中,除了常规的影片评介、影人采访,还有关于史东山生活经历、爱情婚姻、兴趣爱好等方方面面的信息,这些内容使得常规电影史述中德高望重、令人敬而远之的史东山形象鲜活生动起来。如果没有相关数据库的开发,依然靠传统方法一头埋进故纸堆中求索,效率低不说,也难以获取如此翔实的资料。因此,在“影人个体数据库”的建构中,需要充分利用相关数据库在资料层面提供的强有力支撑。

在某种程度上,谱主的确定和资料的选择反映着编纂者的史观。传统意义上的年谱编纂依然秉持的是精英史观,多集中关注著名人物、精英人士。这是因为著名人物更受关注,学者投入的研究精力更多,出版机构更愿意出版,涉及从学术生产到出版的整个链条。在这种情况下,那些不那么有名的人物就难以受到关注,也就更谈不上年谱的编纂了。基于开源数字平台的影人年谱,将编纂权力开放给大众,打破了学术体系的封闭性和神秘性,使得更多人能够参与进来,只要是自己感兴趣的影人,都可以在CCKS平台上为其建立年谱条目,构建专属的“影人个体数据库”,因而能够将大众关注的重点从精英人物逐渐转向电影史上的“无名者”和“沉默的大多数”。这样一来,就可能搜寻到更多被电影史忽略或遗忘的影人,丰富中国电影史的面貌。这是一种对传统的精英史观的变革,反映的是“从下到上”(from below to above)的史观,能够从不同的角度丰富电影史的构成,就客观影响而言,就是在拯救历史。

更重要的是,在“影人个体数据库”中,所有入库影人的生平都是数据,没有高下之分,都能够在数据和信息资源意义上发挥其更大的价值。身处计算机时代,列夫·马诺维奇(Lev Manovich)把数据库称为“一个新的符号形式,一种构建自身体验和世界体验的全新方式”(12)[俄]列夫·马诺维奇:《新媒体的语言》,车琳译,贵州人民出版社2020年版,第223页。。CCKS平台通过将信息“分类”,使得用户摆脱了传统媒体形式所采取的线性文本的控制,能够以不同的“索引”方式,随意在平台上各个信息模块之间跳转;并且,在CCKS平台上呈现出来的影人年谱,每条数据都会标明原始出处,有助于后来者按图索骥。这些都体现了数据库的索引和导航功能。“数字媒体复活的是古老的导航功能:为我们指明时间和空间,给我们的数据建立索引,确定我们的坐标。”(13)[美]约翰·杜海姆·彼得斯:《奇云:媒介即存有》,邓建国译,复旦大学出版社2020年版,“绪论”第8页。正是这种索引和导航功能,使得依托CCKS平台以开源众包方式打造的“影人个体数据库”并非封闭的存在,而是始终处于动态的生成过程中,能够为未来的人们保留下属于谱主生活年代的信息,也能保留下年谱编纂时代的痕迹。因此,作为开展影人年谱编纂的“物质基底”和基础设施,CCKS平台必将在“影人个体数据库”的构建中发挥更大的作用。

二、基于数字平台的“心灵考古”

自20世纪80年代末起“重写电影史”的大潮席卷而来,经过几代学者多年孜孜不倦的钻研,中国电影史研究在整体上已经取得了长足的进步。然而,在“重写电影史”的热闹与喧嚣之中,对影人的研究却相对滞后,也远不是热点,对非著名影人则更少关注。(14)电影学的相关期刊上刊登过多篇关于影人研究的论文,但大部分也都只是对某个影人的初步研究,尚有很多地方需要进一步深入。影人年谱的编纂或许可以推动影人研究的进一步深入。

编纂影人年谱重在对资料的收集、整理,在此基础上发掘谱主的心路历程,对人的心灵、个性与时代之关系进行勘探、发掘和重建。李道新在论证影人年谱的功能和目的时指出:“以更加勤苦、谨严的姿态和客观、翔实的方式进入中国电影的历史现场和本土语境,在最大限度还原社会历史面貌和体认影人生命轨迹的过程中,为中国的电影史研究提供必要的知识积累和价值导向。”(15)李道新:《影人年谱与中国电影史研究》,《当代电影》2019年第1期。因此,影人年谱除了“还原社会历史面貌”,还应当能够“体认影人生命轨迹”。这也就意味着,数字时代影人年谱的编纂,依然要以“人”为中心、以“人”为主体。所谓以“人”为中心、以“人”为主体,就是要考虑到谱主的从业经历、社会经历、个人生活三个层次,即从“专业史”“社会史”“心灵史”三个维度(16)陈墨在《中国电影人口述历史:实践与理论》(《当代电影》2010年第3期)一文中提出,“要在口述历史采访中探索并建立专业史、社会史、心灵史的三维空间”,本文在此借鉴之。,尽可能完整地呈现谱主的生命历程和专业工作,进而能够得窥其所处时代之一斑。

多年来,公开出版的个人回忆录、日记、自传、传记和影人的口述历史,都可被视为一种年谱或类年谱的形式。(17)李道新在《影人年谱与中国电影史研究》(《当代电影》2019年第1期)一文中详细列举了此前可被视为影人年谱的各类出版物和相关成果,这些成果都为影人年谱的后续研究奠定了基础。然而,个人的回忆录是个体记忆,准确与否受到个体记忆能力、资料的可获得性和主动求证的能动性等多种因素的制约。谱主个人回忆难称精确,口述历史采访者虽然可以在与谱主的互动中进行记忆的钩沉,但是因为自身学识有限或者所受学术训练程度的高低不同,依然难免出现各种错误和不足。影人年谱的编纂看似只是对影人的具体活动按日期加以编排,从而勾勒影人生平,但实际上是严肃的学术研究。编纂影人年谱需要对谱主相关史料仔细甄别,编纂者往往需要考察大量资料,除常规的报刊信息,还要尽可能穷尽相关的著作、手稿、回忆录、采访、日记、录音、录像等,并对这些资料进行比对、分析、辨别,才能筛选出尽可能准确的资料。在CCKS平台上编纂“胡金铨年谱”的过程中,胡金铨的出生日期引发了争论。香港电影资料馆官方网站,胡金铨侄女胡维尧所编《胡金铨电影传奇》(明报出版社2008年版)、《胡金铨随笔》(复旦大学出版社2013年版)以及胡金铨口述、日本电影学者山田宏一和宇田川幸洋所著《胡金铨武侠电影作法》(北京联合出版公司2015年版),对胡金铨出生日期的说法都有所差别,这就需要编纂者进行详细考辨。

传统年谱需要某个或几个学者穷尽若干年甚至一生的精力,对各种史料进行搜集,才能编纂完成,还难免存在疏漏。数字平台的开源特性,将年谱的编纂权力下放,将史料的搜集整理、条目的添加功能开放给大众,每个人都可以为此做出贡献,因此年谱编纂的整体效率会成倍增加。参与者相互之间通过平台形成的网状勾连,能够对年谱条目进行交叉审核、校对,可以最大限度避免错误的产生,也为影人研究提供了更多便利。

随着数字时代的到来,研究者开始寻求研究人文与技术相结合的新方法与新思路。如果将“影人个体数据库”中影人的活动轨迹整合起来,会产生海量的数据。随着数据的丰富,谱主和编纂者之间、不同的编纂者之间、不同的“影人个体数据库”之间必然会发生联系。那么,在面对海量的史料数据时,研究者该如何筛选并呈现出影人的生活及职业发展路线?影人的思想、观念、情感等属于精神层面的内容,是否能够通过数字化手段将其可视化呈现?处在某一坐标系中的影人个体与自身、与他人、与环境的关系如何?回答这些问题,需要在实践中穿透数字的表象,施以人文关怀。

正如陈墨所言:“所谓心灵考古,就是要在人类心灵深海或人脑神经宇宙的广袤星空中探寻、打捞、发掘并激活某些重要的个体生命记忆信息”(18)陈墨:《中国电影人口述历史:实践与理论》,《当代电影》2010年第3期。,“心灵考古工作目的在知人,这也正是学者论世或论史的前提”(19)陈墨:《再论口述历史与心灵考古》,载陈墨:《口述史学与心灵考古——论文与演讲集》,人民出版社2019年版,第86页。。虽然他所言的“心灵考古”是基于口述历史工作的特性及其相关功能的阐释,但在数字时代的影人年谱编纂中,“心灵考古”可以为我们更好地深入理解谱主及其所处时代环境提供启发。从“心灵考古”的角度出发,基于数字平台上的影人年谱打造“影人个体数据库”时,应该超越传统意义上只关注谱主生活和工作经历的编年式、资料归拢式的编纂模式,充分利用数字平台在数据整合和集成上的潜力,探究更广阔的社会变迁对谱主工作、家庭、生活的影响,以及给其生命体验带来的变化。唯其如此,方符合影人年谱之以“人”为中心的编纂取向。在这个意义上,影人年谱的编纂同时也是一种对谱主的“心灵考古”。

在考古学界,有人认为“考古学‘研究工作的全部目的是重建已逝生活(彼特里)’”(20)张忠培:《中国考古学:实践·理论·方法》,中州古籍出版社1994年版,第144页。。对“影人个体数据库”海量数字档案资料的挖掘和分析也可看成一种考古行为,其所得可为各学科提供海量资源,重建过去的信息,加深对人、社会、时代的理解。依托CCKS平台上详细的影人年谱数据,在相应数字工具的加持下,对这些数据进行挖掘和可视化分析,就能够呈现出某一个影人的生活状况和成长脉络。更重要的是,一个人从出生到死亡,无时无刻不处在与周围人的交往之中,同时受到所处时代背景的影响。随着影人年谱数据的增加,CCKS平台还能够构建出众多影人之间复杂的交往网络,进而呈现出其与大时代背景之间的关联。这就突破了对单一影人的静态研究,CCKS平台通过将人与人之间的交往网络与时代背景相关联,能够进一步为我们更好地理解某个影人和某一类影人群体提供坚实支撑。

在海量的数据面前,我们仍然需要警惕,不能沉浸在数据中并成为简单的数据搬运工。“只有将某一现象放入个体的整个生命历程中进行评估,我们才能真正理解它的本质作用。只有在确保个体的每一种外在表现都是他们总体行为模式的某一层面之后,我们才能深入考察人类的思考方式。”(21)[奥]阿尔弗雷德·阿德勒:《理解人性》,罗鸿幸、王心语译,新世界出版社2016年版,第78页。基于“影人个体数据库”进行“心灵考古”,就是这种人文性的体现。

与常规的考古作业不同的是,“心灵考古”的对象是人,其目的是知人论世。“心灵考古”需要从数据和信息入手,借助一定的计量工具对“影人个体数据库”中收录的数据和信息进行挖掘,将数据信息作为发掘人类精神活动的资料。“每个个人的成长心路、社会经历、工作经历、情感经历、历史见闻、生活感受和生命思考,都有其不可替代的个体独特性。”(22)陈墨:《再论口述历史与心灵考古》,载陈墨:《口述史学与心灵考古——论文与演讲集》,人民出版社2019年版,第75—76页。与此同时,每个人都在社会中成长,是社会化的产物。基于“影人个体数据库”进行的“心灵考古”,就是通过数字手段重建个人的生命历程、生活场景,兼及其所处社会风貌和时代特征。在科学手段的加持下,通过对人的“心灵考古”,能够与不同学科产生链接,为相关学科的发展提供充足的资源。因此,借助“心灵考古”的方法,可以将“影人个体数据库”打造成社会变迁的信息库、学术研究的资料库、个体生命的体验库。

三、大数据、数字人文与知识生产

开源众包的目的是更好地促进知识生产和创新。“开源模式实际上是一种依托互联网平台,通过大规模群体智慧共同参与和协作,不断累积智慧,实现持续创新的方法。”(23)中国开源软件推进联盟:《中国开源发展概述、机遇与挑战》,《软件和集成电路》2022年第2、3期合刊。开源平台的参与者可以充分利用前人提供的学术资源,在很大程度上避免重复劳动,大幅降低了获取知识的难度和成本,因而更加有利于知识的更新和迭代,能更好地促进知识生产。目前,CCKS平台还处在资料归集、信息和数据开源的阶段,如何最大限度发挥影人年谱在知识生产中的作用,是平台建设好之后需要着重考虑的问题。

在大数据时代,数据成为一种不可或缺的生产要素。“人类可以‘分析和使用’的数据在大量增加,通过这些数据的交换、整合和分析,人类可以发现新的知识,创造新的价值,带来‘大知识’、‘大科技’、‘大利润’和‘大发展’。”(24)涂子沛:《大数据》,广西师范大学出版社2013年版,第57页。大数据革命是人类历史上所进行的一场力度之大、范围之广、程度之深皆前所未有的变革,“而文本也可以‘溶化’成无形的、随时可以变革和重新塑造的大量数据”(25)冯亚琳、[德]阿斯特莉特·埃尔主编:《文化记忆理论读本》,北京大学出版社2012年版,第18页。。当一个个“影人个体数据库”汇集在CCKS平台上时,其所包含的各种类型的海量数据无疑是一笔巨大的财富。(26)截至本文写作时,CCKS平台上费穆年谱和史东山年谱的数据均超过了600条,且还在不断丰富中。试想,如果有100个、1000个甚至更多影人的年谱在CCKS平台上线,其中包含的文字、图片、录音、录像等各种类型数据的数量无疑是极为可观的。面对这些数量庞大的数据,传统研究方式当然会从中获益。笔者自身就有深刻体会,在对中国电影史上的著名导演史东山进行研究时,由于搜集到的资料有限,一开始无法得出史东山与早期美术团体晨光美术会发生联系的准确时间,只能推测出一个粗略的时间框架,但是得益于CCKS平台上的史东山年谱,笔者得以弥补资料搜集上的不足,能够将史东山加入晨光美术会的可能时间范围大幅度压缩,从而提高了研究的精确性。不过,要想充分发挥这些数据的潜能,还需要更深入的数据挖掘,这势必要求我们在研究方法上进行革新。近年来兴起的数字人文研究,或许就是一个可能的方向。

作为一种研究方法,数字人文在国内外逐渐盛行,席卷人文社会科学的各个领域。数字人文研究其实就是具有专业知识的学者,以相应的定量研究工具,对海量数据进行挖掘、整理、分析的一种研究方法。“高水平技术设施能够促进高质量的、创新的、兼具理论性和试验性的数字人文工作。”(27)[英]大卫·M. 贝里、[挪]安德斯·费格约德:《数字人文:数字时代的知识与批判》,王晓光等译,东北财经大学出版社2019年版,第110页。应该说,作为数字基础设施的CCKS平台以及依托其开展的“影人个体数据库”的建设,使得中国电影学界以大数据为基础开展数字人文研究具备了可行性。

前文论述了对影人进行“心灵考古”的可能性,这是依托于“影人个体数据库”向内进行的挖掘,而“数字人文则是有关整合和生成性的实践:用专家知识的方块建立更大的图景”(28)Todd Presner、Jeffrey Schnapp等:《数字人文宣言2.0》,桂文瑄、叶梓涛译,叶梓涛校,“落日间”微信公众号2022年7月7日推送。。影人的活动勾连着大到时代、社会,小到职场、家庭等不同圈层,通过“影人个体数据库”向外,还能够连接起相关影片和影事,进而可窥影史之一斑。普泽南、李鹤伊、乔宁、孙婧等学者对可能的研究方向进行了初步探讨(29)参见普泽南:《从数字人文的起源看影人年谱与其关系》,《电影艺术》2020年第4期;李鹤伊:《数字人文、文化分析与中国影人年谱的可视化》,《郑州大学学报(哲学社会科学版)》2021年第5期;乔宁:《数字人文时代基于社会网络分析法的影人年谱研究初探》,《电影评介》2022年第2期;孙婧:《数字人文与电影史研究的“显宏镜”》,《电影艺术》2022年第4期。,但这些研究均有一个大的前提,即需要以海量且易获得的数据为依托。杨世真、陈刚、范倍、范志忠、乔洁琼、唐媛媛、李春芳、朱子彤等多位学者的计量电影学研究成果(30)参见杨世真:《计量电影学的理论、方法与应用》,《当代电影》2019年第11期;陈刚:《计量电影学与费穆电影结构的可视化路径》,《电影艺术》2020年第4期;范倍、郭柳蹊:《风格的代际转移:中国第五代、第六代导演的计量学研究》,《贵州大学学报(艺术版)》2021年第3期;范志忠、于欣平:《计量电影学视阈下新主流电影工业集体创作的可视化路径》,《艺术百家》2021年第6期;乔洁琼:《中国早期电影风格管窥(1922—1937)——基于计量电影学视角》,《电影评介》2021年第22期;唐媛媛、师志豪:《计量电影学视域下的红色电影研究——可视化路径与美学内涵》,《电影文学》2022年第10期;李春芳:《〈阮玲玉〉计量分析与中国早期影人图谱》,《电影艺术》2022年第4期;乔洁琼:《重写电影史视域下史东山电影风格的计量学考察》,《当代电影》2023年第4期;朱子彤:《数字人文视域下的吕班电影研究——以CiteSpace、Darwin、微词云、Voyant为主要工具》,《当代电影》2023年第4期;唐媛媛:《“十七年”国产彩色电影的色彩计量研究》,《当代电影》2023年第4期。,都是个人或带着学生组成的小团队进行的定量分析,需要处理的数据量相对较小,尚缺少对大规模数据的统计、量化与论证。

因应大数据时代的特征,美国斯坦福大学教授弗兰克·莫莱蒂(Franco Moretti)提出的“远读”理论或许可以提供一些借鉴。“远读”是建立在大量文本数据的基础上,“借助于社会科学的定量分析和图表示意、地理学的地图、进化论中的系谱树,构建出一系列抽象模型”(31)宋炳辉:《新文科时代如何文学?——兼及莫莱蒂的“远读”理论》,《燕山大学学报(哲学社会科学版)》2022年第2期。。大数据分析方法可以处理与某个论题相关的全部数据,重在探讨数据之间的相关性。要想更好地挖掘“影人个体数据库”中海量数据之间的关联,“远读”无疑是一种可行的方式。使用定量分析方法从中发现规律,从而能够达到一种宏观视野的整体观照。在计算机数据挖掘技术的加持下,以“远读”为方法,能够为寻找不同影人、影片、影事在同一时空或者不同时空之中的相互关联提供便捷,可视化、地理信息系统、影人关系图谱等也都具有了实现的可能,进而能激发出新的研究生长点。

数字人文的研究方法引入人文学科之后,多学科团队协作的知识生产方式将越来越普遍,因而能够促使新的研究工具的开发和学术生产方式的蜕变。为了适应这一趋势,未来或许可以参考一些开源科研平台的模式。有学者将开源平台分为三种模式:一是开源社区,网络大众完全凭兴趣和爱好不计报酬地参与平台事务,诸如维基百科、百度词条;二是事务众包,网络大众完成平台上发布的事务并获取一定的物质报酬;三是科研众包,网络大众群策群力为平台上发布的科研任务提供解决方案并能获取丰厚报酬。(32)参见庞建刚、刘志迎:《科研众包参与主体及流程的特殊性》,《中国科技论坛》2015年第12期。当前,CCKS平台的参与者不计报酬、完全凭一腔热忱和专业追求参与其中,因此它目前还属于第一类“开源社区”。接下来可以考虑设立一些奖励措施,以鼓励更多人参与其中,将平台从单纯的“开源社区”发展到“事务众包”乃至“科研众包”,进而将单一线性的电影史进行丰富拓展,展现特定历史节点中的人物和事件,以透视其所在的时空切面乃至整体,为电影史乃至整个电影学研究带来更多的知识生长点。更进一步,CCKS平台通过开放接口与其他数据库相连,能够参与到更广阔的人文社会科学的研究当中,或许能够产生出我们完全无法预料的更大规模的应用以及学术成果。这样一来,依托于CCKS平台编纂的影人年谱,其意义就能够大大超出电影史乃至电影学的学科范畴,在更大范围内发挥作用,成为学科之间融会贯通的一个中介。

需要注意的是,在数字人文学者凭借各学科的集团作战优势掀起了一场声势浩大的学科范式、研究方法变革的同时,我们在这股热潮中始终需要清醒地思考:“数字”与“人文”二者何为重点?“数字”并不是万能的,更不能替代人文学科的内在精神品格。通过简单数据检索和数字化修饰即产出一篇论文的快餐式做法,是学术研究的大忌。唯有如此,才能回归数字人文和知识生产的初心。

四、结语

CCKS平台横空出世并确立开源众包的方式,呼应了数字时代信息和数据开放的大趋势。基于其打造的中国影人年谱,当以构建“影人个体数据库”为目标,以海量数据和资料为基础,借助新的数字技术尝试进行“心灵考古”,促使其从现阶段仅作为知识开放的平台升级成一个全新的知识生产平台,如此这般,“将在很大程度上更新中国电影的知识结构,影响中国电影的研究格局,进而重组中国电影的学科体系”(33)李道新:《影人年谱与中国电影史研究》,《当代电影》2019年第1期。。当然,如何建立一个有效的、确保信息准确性的审核机制,平台的开源众包和审核机制之间的关系如何平衡,CCKS平台应该如何将自身与维基百科、百度百科等区别开来,这些都是在实践中需要进一步探讨和解决的问题。

猜你喜欢
影人年谱开源
证肇经先生年谱(续8)
读《郭沫若年谱长编》的几点思考
五毛钱能买多少头牛
影人姚晨
朱彝尊年谱新考
诡异的屋内“怪影人”
大家说:开源、人工智能及创新
开源中国开源世界高峰论坛圆桌会议纵论开源与互联网+创新2.0
《清钱编年谱》(英文原版)订购方法
开源计算机辅助翻译工具研究