人工智能时代文本与数据挖掘的版权豁免规则建构

2021-01-07 11:44张惠彬肖启贤
科技与法律 2021年6期
关键词:合理使用

张惠彬 肖启贤

摘    要:科学研究自由是我国《宪法》所赋予的基本权利,该项权利保障了科研人员从事科学研究不受非必要的限制,从而有利于促进科学技术的发展。人工智能时代,文本与数据挖掘作为一种基础性的科学研究方法,已成为科学研究自由的新范式。从我国法律体系上来看,文本与数据挖掘受到版权法律制度的严重制约,存在巨大的版权侵权风险。豁免科学研究中实施文本与数据挖掘的版权责任是各国版权法律制度发展的趋势。我国第三次《著作权法》的修改虽对合理使用制度加以完善,并一定程度上考虑了科学研究发展的需要,但总体上仍无法满足人工智能时代的需求。借鉴欧盟《数字化单一市场版权指令(2019)》第三条的规定,增设“以科学研究为目的的文本與数据挖掘合理使用”,对于保障人工智能时代的科学研究自由,实现科技自立自强和人工智能战略具有重要意义。

关键词:文本与数据挖掘;科学研究自由;合理使用;著作权法修改

中图分类号:D 923.8          文献标志码:A              文章编号:2096⁃9783(2021)06⁃0074⁃11

引  言

新冠肺炎疫情暴发后,全球都在寻找科学抗疫之路。在疫情数据监控、病毒机理分析、防控措施等方面,文本与数据挖掘(Text and Data Mining,简称TDM)成为抗疫的重要工具,为打赢抗疫之战提供了有力保障。自人工智能技术兴起后,TDM对于提高科研效率、加速科学发现、支撑科研创新、促进经济增长越来越重要[1]。使用TDM开展科学研究的自由已经成为人工智能时代科学研究自由的应有之义。然而,TDM过程中所涉及的文本与数据的提取、复制与传输等环节大部分为版权法所限制,在我国著作权法语境下面临严重的侵权风险。主张版权遭受侵害的当事人能否伸张权利?抑或是科研人员得以在“科研自由”的宪法保护伞下免其版权责任1?从国际层面来看,为科学研究中使用TDM的行为设立版权例外,豁免其版权侵权责任,已成为各个国家和地区的普遍做法。2019年3月,欧盟通过了《数字化单一市场版权指令(2019)》(以下简称《DSM指令》),在欧盟层面引入了TDM版权例外制度。《DSM指令》是当前全球数字版权领域影响最广泛的立法成果。2020年11月,我国《著作权法》第三次修改对合理使用制度进行了完善,但在保障人工智能时代科学研究中TDM技术的自由使用方面仍然十分不足。有鉴于此,本文在充分考察人工智能时代TDM在科学研究领域的重要作用的基础上,通过规范分析的方法对我国《著作权法》修改后,科学研究中TDM的版权风险进行解构;通过比较法研究的方式,解析欧盟《DSM指令》的具体做法,检视我国《著作权法》第三次修改的不足,并提出相应的完善之策。一、TDM已成为人工智能时代科学研究自由的新样式

(一)TDM是人工智能时代科学研究的新手段

人工智能2时代是继网络时代、大数据时代之后,人类所面临的技术和社会变革最为深刻的时代[2]。其不仅从科学研究成果上为人类社会带来了多种可能性,也从科学研究的过程中体现了与过去完全不同的思维,引发了科学研究方法的创新。人工智能时代,TDM成为科学研究的重要手段。其以大量的资料为基础,通过算法的设置实现自动分析并生成有用的知识,将人类从无穷无尽的文本和数据中解放出来。

现代人工智能的核心技术是基于数据的机器学习,即从观测数据(样本)出发寻找规律,并利用这些规律对未来数据或无法观测的数据进行预测的技术[3]。大数据、机器学习等人工智能理论与成果的应用,极大推动了TDM技术的发展。用数据库管理系统来存储数据,用机器学习的方法来分析数据,挖掘数据背后的知识,这两者的结合促成了数据库中知识发现(Knowledge Discovery in Databases,KDD)的产生,而数据挖掘3是知识发现最核心的部分[4]。虽然经典的TDM和机器学习并非完全相同,但两者均使用相同的关键算法来发现数据中的模式[5]。国外学者普遍认为:“TDM是机器和深度学习的基石,如果没有利用计算机分析大量数据并使用认知技术来发展学习模式的能力,人工智能是不可能存在的”[6]。吴汉东教授亦指出:“文本和数据挖掘,可视为从另一角度对人工智能技术过程的表述”[7]。因此,TDM既得益于人工智能技术的发展,同时也成为人工智能时代最为基本的技术手段之一。

《DSM指令》将TDM定义为:“任何旨在分析数字形式的文本和数据,以便生成包括但不限于模型、趋势、相关性等信息的自动分析技术”[8]。简言之,TDM几乎包含了所有使用计算机来进行信息索引、分析、评估和解释的活动[9]。TDM一般均存在四个技术步骤:

第一步,信息的获取。TDM的对象是数字形式的文本或数据,其获取的途径包括但不限于使用爬虫等方式从网上直接抓取或通过应用程序接口(API)获取。在该步骤中,所获取的信息可能被复制并储存在服务器中。第二步,目标数据集的创建。TDM的实施者将对获取的信息进行预处理以剔除不必要的信息或对信息进行标准化处理。并非所有的信息均可直接进行TDM,如自然语言文本通常需要转化成可为计算机处理的结构性数据。经过处理的文本或数据将形成一个新的目标数据集,用于开展数据挖掘。第三步,数据挖掘。研究者利用载有挖掘程序的计算机对数据集进行分析,以生成所需要的模型、趋势、相关性等知识。第四步,挖掘结果及发布。这一步骤取决于TDM实施者的研究目的,如通过期刊论文、专著或内部文献等形式将挖掘结果进行公布。

从以上步骤中可以看出,TDM与传统的科学研究方法最大的不同之处在于其实现了信息的“机器阅读”,甚至改变了人类作为知识创造唯一主体的局面。人工智能时代,人类社会所产生的信息将难以计数,大数据驱动知识学习已经成为一种必然的趋势。因此,有学者认为,“数据挖掘这种新时代的科学新工具让我们实现了用数据化手段测度人类行为和人类社会,再次改变了人类探索世界的方法”[10]。从目前的趋势来看,这一说法并非夸大之词。在计算语言学领域,使用TDM的研究项目约占25%~30%;在提高生物医学发现的效率、优化自然资源的管理和使用等方面,TDM也同样收效良好[5]。TDM已经成为人工智能时代不可或缺的科学研究方式。

(二)TDM在我国科学研究中的应用现状

我国当前在人工智能技术的研发、应用和产业发展方面具有较大的优势,相关领域的论文发表数量、专利拥有量以及部分领域的核心关键技术均处于世界前列。人工智能成为我国经济发展的新引擎,在国家自主创新战略体系和国际竞争中扮演着重要的角色。人工智能时代的到来,TDM成为我国各领域科研工作中最为广泛使用的基础性研究方法之一。以TDM在抗击新冠肺炎疫情中的应用为例,我们大致可以一窥其在我国科研工作中的重要意义。

2019年末,新冠肺炎疫情暴发后,清华大学AMiner团队联合多个科研团体在其科技大数据挖掘服务平台基础上研发上线“知识疫图”系统。该系统汇集了包括疫情、科研、知识、媒体、政策等300余项与新冠肺炎有关的数据资源,开发了新冠肺炎开放数据集、疫情智能驾驶舱、高关注学者分析、新冠肺炎学术成果时间线,以及新冠肺炎期间用户在线社交行为研究等功能模块[11]。其中,新冠肺炎开放数据集为TDM的实施提供了重要的基础;学术成果时间线对大量的论文文献以及从新闻媒体、社交平台等渠道提取的大量信息进行文本与数据挖掘,并以时间轴的形式集中呈现其中的学术观点、热点事件等;高关注学者分析则对包括钟南山、李兰娟等国内外重要学者的学术领域、学术水平等信息进行挖掘,为研究人员和公众提供相关的知识;用户在线社交行为研究则以微信大数据等为基础实现对用户疫情期间心理状况的自动分析;在疫情趋势预测等方面TDM也作出了重要的贡献。另有学者利用TDM等技术构建疫情追溯数据模型,以实现短时间内对高风险人群和地区的精准定位[12];通过对微博文本进行TDM来研究疫情心理时空距离对公众情绪的影响等[13]。

此外,TDM技术在金融、交通、公共卫生、文本分析、传统医药研究、社会舆情分析、市场决策等领域也拥有广阔的应用前景和众多成功案例。有学者更断言,“在人工处理数据洪流已经变得不可行且过于昂贵的当下,效率与耗费在客观上促使TDM成为必须行动的项目”[14]。随着5G时代的到来,人类将进一步被信息的洪流所淹没,TDM所具有的意义将更加凸显。因此,TDM并非仅仅是一个新颖的科学概念,其已经成为现实中普遍存在的科学研究手段,并深刻影响我国科技、经济以及社会发展的进程。

(三)人工智能时代科学研究自由的新样式

从各国的情形来看,TDM均非绝对无限制之自由,其最主要的限制来自各国版权法律。TDM作为一种科学研究方法,必须以大量的文本(如数字图书、网络中的文章、期刊等)或数据(数据库或其他形式的数据资源)为基础。其在挖掘过程中通常涉及到对受版权法保护的文本或数据的复制、发行、改编、翻译等行为。没有版权人的授权,此类行为均涉嫌侵害他人版权权利。尤其是在涉及商业使用时,TDM可能会对版权人的利益造成一定的损害。因此,TDM的使用雖然十分重要并且广泛,但并非是没有限制的任意使用。

科学研究自由是《中华人民共和国宪法》(以下简称《宪法》)所保障的一项公民基本权利,其也为《中华人民共和国科学技术进步法》和《中华人民共和国高等教育法》所明文规定4。学者认为,我国《宪法》语境下的科学研究自由应当包含“研究自由”与“教学自由”。所谓研究自由是指研究者不受非法的限制和拘束,而选择研究对象、目的、方法、场所、时间的自由,以及发表研究成果的自由[15]。从TDM的过程来看,其主要关涉科学研究方法的自由以及发表研究成果的自由。具体而言,则存在以下两个方面的考虑:其一,TDM作为一种新的研究方法,研究人员是否有不受限制而使用的权利?其二,TDM所产生的研究成果是否能够自由发表?由于TDM与人工智能的密切关系,以上两个问题的答案均深刻影响着人工智能时代国家科学技术的进步以及综合力量提升。

TDM已经成为科学研究自由的新样式。从科学研究自由的内涵上考察,TDM作为人工智能时代科研人员开展研究所必备的手段,其属于科学研究方法自由之列。而发表利用TDM所产生的研究成果则自然属于发表研究成果的自由。将TDM归于科学研究自由之列,深层次的原因则在于科学研究自由所具有的集体性价值导向。有学者指出:“知识创新、科技进步是需要学术自由5作为法治保障的,所以学术自由的集体性价值,也就是对于提高国家的国际竞争力的作用和价值,已经超过以往的任何时代”[15]。欧盟《DSM指令》在序言中指出,随着研究越来越多在数字技术的协助下进行,除非采取步骤解决TDM方面的法律不确定性(笔者注:主要是指版权侵权的风险),否则欧盟作为一个研究区域的竞争地位将受到影响。欧盟豁免科学研究中TDM版权责任的初衷即在于TDM在促进知识创新和科技进步方面所体现的集体性价值。

从实践层面看,TDM作为一种科学研究自由已经为大多数发达国家所认可。美国作为人工智能技术和产业最发达的国家,其版权法为TDM在科学研究中的使用提供了充足的空间。美国版权法第107条规定的合理使用原则所固有的灵活性,使法官在面对纠纷时能自为判断TDM的使用是否符合公平理念。在“作家协会诉HathiTrust”案以及“作家协会诉谷歌公司”案等案件中,美国法院均认为TDM构成合理使用,从而不构成侵权[1]。在《DSM指令》生效两年内,欧盟所有成员国均需将指令内容转化为其国内法律。因此,欧盟境内将普遍承认TDM属于科学研究自由的范畴。此外,日本也早在2009年即确立了TDM版权例外,是全球最早开展该立法的国家6。由此观之,TDM作为一种科学研究自由,其不仅具有理论上的依据,也是国际版权立法的趋势。

二、科学研究中应用TDM的版权风险

任何自由均非绝对,科学研究自由其本身也受到宪法和法律的外在限制。根据《宪法》第五十一条的规定:“中华人民共和国公民在行使自由和权利的时候,不得损害国家的、社会的、集体的利益和其他公民的合法的自由和权利”。TDM作为一种人工智能时代的科学研究自由样式,在理论上具有其合理性。然而,从我国法律体系上来看,其受到版权法律制度的严重制约。

(一)TDM版权风险解构

TDM之所以存在版权风险,原因在于挖掘的对象往往是受版权法保护的作品。《中华人民共和国著作权法》(以下简称《著作权法》)第三条规定了九种法定作品类型,其中包括文字作品、美术作品、摄影作品、视听作品、图形作品、计算机软件作品等在内的作品类型均可以作为TDM的对象。此外,根据“汇编作品”的规定,即使是不构成作品的数据以及其他内容的集合,只要其选择和编排具有独创性,则该汇编而成的集合也可以作为汇编作品而受到保护。目前,科学研究中常见的TDM对象(如网页内容、期刊文章、数字图书等)绝大多数都是版权法所保护的客体。

从TDM的过程来看,其所涉及的版权权利类型众多。《著作权法》第十条明确了著作权人可排他利用作品的各种行为类型,也即著作权人的专有权利范围。其中包括对作品的复制、修改、发行、信息网络传播、改编、翻译等权利。TDM的第一步需要获取各种文本和数据信息,用于创建目标数据集。该过程一般需要对目标信息进行复制并保存,从而涉嫌侵犯复制权。目标数据集的创建包含了信息的预处理过程,包括对信息进行翻译、删改、整理、汇总、格式转换等步骤。这一过程则有侵害他人翻译权、改编权以及汇编权的可能。而在挖掘过程中,同样也涉及信息的复制。挖掘形成的研究成果的发布或者具体利用则会引起侵害信息网络传播权、改编权等问题。因此,TDM在科学研究中的运用具有极大的侵权风险,容易引起版权纠纷。“谷歌数字图书馆”系列案件是学界公认的与TDM相关的著作权纠纷之一。该案件的起因在于谷歌公司与多家图书馆合作将馆藏书籍进行扫描和数字化,并将数字化的图书汇编为一个巨大的数据库作为其数字图书项目的一个部分。谷歌公司以此为基础向用户提供检索服务,用户可以检索到包含检索词的内容片段(无法阅读全文),并可对检索词的出现频率进行分析。此外,该项目也为文本与数据挖掘、相关算法开发等提供了极大支持。截至2014年,谷歌公司已经对超过2千万本图书进行了扫描和数字化。然而,由于谷歌并未获得版权人的授权,从2005年起,其遭到了来自作家协会以及个人作者的起诉。该系列纠纷在美国持续了超过10年的时间,直到2016年美国法院最终认定谷歌的行为属于合理使用[16]。而在我国发生的,与“谷歌数字图书馆”项目相关的案件“王莘诉北京谷翔信息技术有限公司、谷歌公司”案中,法院认为“片段式”为他人提供检索构成合理使用,而“全文扫描”原告作品的行为则构成对原告复制权的侵犯7。在TDM项目中,对作品的全文复制是常见的操作。因此,相对于美国,TDM的实施在我国具有更大的版权侵权风险。

(二)合理使用制度无法提供适当的豁免

虽然科学研究自由会受到版权的制约,但并非没有别的出路。《宪法》本身即确立了一种二元限制的结构,即以私人权利为代表的个体性自由主张与以科学研究自由为代表的集体性自由主张之间构成相互制约、相互平衡的二元结构。“前者为确保作者对其创作的作品的权利奠定了宪法基础,后者则保障了后续作者和其他使用人对他人作品利用的权利。”[17]此外,促进科学事业的发展也是我国《著作权法》的重要立法目的。因此,版权人的权利在一定程度上也应当受到科学研究自由的制衡。这一点最直接的体现则为“合理使用”制度。我国现行《著作权法》第四节为“权利的限制”,其中第二十四條规定了两种与科学研究自由相关的合理使用,即“为个人学习、研究或者欣赏,使用他人已经发表的作品”“为学校课堂教学或者科学研究,翻译、改编、汇编、播放或者少量复制已经发表的作品,供教学或者科研人员使用,但不得出版发行”。符合上述规定的作品使用行为因构成合理使用而可以不经著作权人许可并无需支付报酬。

现行合理使用制度难以满足科学研究中TDM的需要。首先,《著作权法》第三次修改中虽然在法定的合理使用类型之后增加了兜底条款,即“(十三)法律、行政法规规定的其他情形”8,但这并不意味着我国合理使用制度从封闭式立法转变为开放式立法,法官仍不得自为创设新的合理使用类型。而目前的其他法律、行政法规中并无任何关于TDM合理使用的规定。其次,此次《著作权法》修改增加了为学校课堂教学或者科学研究合理使用9的行为类型,即增加了“改编、汇编、播放”三种行为。显而易见的是,立法者已经认识到当前课堂教学或科学研究中对作品使用的需要已不仅仅是翻译和少量复制。仅就TDM而言,就包括了复制、翻译、改编、汇编等众多作品使用行为。只是这一修改虽有其进步之处,但仍然难以为科学研究中的TDM提供豁免。因为该项合理使用不仅存在主体限制——限于公共性质的学校、科研院所等,也存在复制数量的限制——仅限于“少量复制”。TDM既已成为人工智能时代广泛运用的科学研究方法,其使用者自然不限于学校和科研院所,而就其挖掘过程来看,则需要对作品大量乃至于全部复制。再者,为个人学习、研究或欣赏的合理使用虽无方式与数量的限制,但其仅限于“个人”主体。当前的科学研究工作基本上已告别了个人单打独斗的模式,而人工智能作为当前最为复杂的科学研究领域之一,更是如此。因此有学者感叹:“在此国际大背景下,文本数据挖掘的例外规定在我国著作权法中却付之阙如”[7]。此不免为我国第三次《著作权法》修改之失。

三、豁免科学研究中TDM版权责任的欧盟经验

2019年3月26日,《DSM指令》以348票赞成、274票反对、36票弃权的结果在欧洲议会获得通过。该指令旨在于欧盟内部创设一个协调一致、高水平的版权保护体系,以促进欧盟境内的创新,激励投资和新内容的生产,避免在数字环境中欧盟内部市场的分裂。文本与数据挖掘的版权例外作为此次欧盟立法的焦点之一,被规定在《DSM指令》第二章“使例外和限制适应数字和跨境环境的措施”中。

(一)立法背景

1.TDM面临极大的法律不确定性

在欧盟原有的法律框架之中,实施TDM的确存在极大的版权风险,但其亦有可能为既有的各种版权例外所豁免。《DSM指令》在序言第(8)项中指出:在某些情况下,TDM可能涉及受版权保护的行为、受数据库权利保护的行为,或者兼而有之,特别是作品或其他内容的复制、从数据库中提取内容等行为。具体而言,TDM可能侵犯欧盟《信息社会版权指令》(Directive 2001/29/EC)所规定的复制权,与《数据库指令》(Directive 1996/9/EC)所规定的数据库特别权利等。但在以上两部指令中,同时也规定了可能适用于TDM的版权例外,包括临时复制例外10和科学研究例外11。然而,临时复制例外的适用具有较为苛刻的条件,包括要求复制是临时的、附带的,是技术过程中不可或缺的组成部分,且不具有独立的经济价值等。而就科学研究例外的情形来看,欧盟各成员国在这项例外是否适用于TDM上存在不一致的规定,且欧盟法律将该项例外限于“非商业目的”并需要注明来源和作者姓名(除非证明是不可能的)[18]。因此,TDM在欧盟即使存在合理使用的可能,但依然具有极大的不确定性,严重影响了该项技术的使用。

2.跨国科研合作受到阻碍

《DSM指令》的目的之一即在于在欧盟各国之间建立统一的数字版权制度,以促进区域内的版权交易与合作。欧洲委员会的报告则指出:“欧盟版权规则的不成体系在例外方面尤为明显,在大多数情况下,欧盟法律规定的例外情况是成员国可选择执行的”[19]。而就文本与数据挖掘版权例外制度而言,在《DSM指令》出台之前,欧盟各成员国之间的立法并不同步。从立法时间来看,英国早在2014年即引入了该项版权例外制度,法国、德国等则相继开展了相关立法。从立法内容来看,各个国家既存的规定之间也并不一致[20]。另一方面,科学研究例外并不具有强制性,欧盟各国版权法律并非必须作出规定。因此,该项例外在欧盟各成员国中的执行情况具有较大的差异性。各成员国之间的法律差异严重影响了跨境科研合作。

3.合同及技术措施阻碍TDM的使用

即使TDM符合了上述临时复制例外或科学研究例外的条件,也不意味着科研机构能够顺利实施该技术。因为在获取供挖掘的信息时,授权人往往可以通过合同条款禁止被授权人进行TDM,或者设置诸多限制。即使是依据版权法可以自由利用的信息(如超过版权时效的作品),信息的提供者也一样可以通过合同条款禁止实施挖掘行为。此外,技术措施的运用也具有同样的效果。因此,欧盟议会的报告指出,“合同和技术措施的结合经常被用于为从事TDM项目的研究者设置不可逾越的障碍”[18]。

(二)欧盟TDM版权例外的具体内容

《DSM指令》采“双轨制”的做法,即区分以科学研究为目的的文本与数据挖掘例外和不限目的的文本与数据挖掘例外,并分别规定于第三条和第四条中。第三条第一款规定:

成员国应当规定,科研机构和文化遗产机构为科学研究目的进行文本与数据挖掘,对其合法获取的作品或其他内容进行复制和提取的行为,属于96/9/EC指令第5(a)与第7(1)条,2001/29/EC指令第2条以及本指令第15(1)条所规定的权利的例外。

1.适用主体和目的

該例外的适用主体仅包括“科研机构”和“文化遗产机构”。按《DSM指令》第2条的规定,科研机构是指大学(包括其图书馆)、研究所,以及其他进行科学研究或以开展涉及科学研究的教育活动为主要目的的实体。且该机构必须符合两个条件:一是以非营利为基础;二是出于为成员国所承认的公共利益而进行研究。文化遗产机构则是指可公开进入的图书馆、博物馆、档案馆或电影、音频等遗产机构。而指令序言指出,为与欧盟现行的鼓励大学、研究机构与私营部门合作的政策相一致,研究组织在公私伙伴关系框架内开展研究活动时,也应属于这种例外情况。以上两类主体均具有较强的非商业性质,受商业机构决定性影响的研究组织,因可能导致商业机构优先获得研究成果而不一定能适用该例外。在适用目的上,例外则仅限于“科学研究目的”,即使是适格的主体也不能以其他目的(如商业目的)自由实施TDM。

2.适用的行为类型

在豁免的行为方式上,包括实施TDM中发生的“复制”与“提取”两种行为。96/9/EC指令第5(a)与第7(1)条所规定的分别为数据库权利人所享有的复制权与提取权(right of extraction)、反复利用权(right of re⁃utilization);2001/29/EC指令第2条规定了版权人或邻接权人所享有的复制权;而《DSM指令》第15(1)条则赋予了新闻出版者对其新闻出版物的邻接权,具体包括复制权和向公众提供权(right of making available to the public)。也即符合该项例外的TDM可免于上述权利的限制。

3.适用的条件

该项例外的适用前提是:用于TDM的作品或其他内容是通过合法渠道获取的。《DSM指令》序言部分指出“合法获取”应理解为包括基于开放获取政策或通过权利人与研究组织、文化遗产机构之间的合同安排(如订阅)以及通过其他合法手段获取内容。此外,由于技术保护措施的存在,即使是合法获取的作品或内容也有可能无法开展TDM。因此,《DSM指令》同时也规定权利人可以采取措施确保承载作品或其他受版权保护内容的网络和数据库的安全性和完整性,但该措施不应该超过实现这一目标所必须的限度。即要求权利人所采取的技术措施应与风险相对称,不应该阻碍TDM的实施。而对于合法获取的作品或内容以及其副本,TDM实施者可以保留作为科学研究或验证研究结果之用,但必须采取适当的方式储存。

4.例外的强制性

以科学研究为目的的TDM例外不允许版权人或数据库权利人通过合同条款排除适用。这是《DSM指令》第三条与第四条之间最大的区别之一。第四条所规定的是不限目的的TDM例外,其适用范围可包含私人或公共部门出于各种目的的TDM,但条件是权利人没有以适当方式明确保留该例外的适用。由此可见,《DSM指令》对于科学研究中的TDM提供了更大的自由度。因为立法者认为,从例外的性质和范围来看,其对于权利人所造成的任何潜在损害都将是最小的。

四、保障人工智能时代科学研究自由的制度设计

我国第三次《著作权法》修改中,在合理使用制度上仍然坚持采用“封闭式”立法模式,即除《著作权法》第二十四条所规定的十三种情形外,其余使用作品的行为很难被认定为属于合理使用的范围。而以科学研究为目的的TDM并非其中任何一种合理使用类型所能包含。这一立法模式虽然具有更大的可预见性和适用的便利性,但随着科技和社会的发展,此模式的灵活性和包容性则明显不足。在我国,甚至出现了司法实践与立法规范背道而驰的乱象。最高人民法院发布的指导意见中指出:“在促进技术创新和商业发展确有必要的特殊情形下,考虑作品使用行为的性质和目的、被使用作品的性质、被使用部分的数量和质量、使用对作品潜在市场或价值的影响等因素,如果该使用行为既不与作品的正常使用相冲突,也不至于不合理地损害作者的正当利益,可以认定为合理使用”12。也即在某些“特殊情形”下,法官可突破我国《著作权法》的封闭规定,适用一定的标准自行判断是否属于“合理使用”。“自此,我国法院在一系列案件中陆续突破著作权法的封闭性规定,结合合理使用四要素展开三步检验法分析,以最终作出是否构成合理使用的司法认定。”[21]由此观之,实践中欲认定以科学研究为目的的TDM为合理使用也并非毫无可能,只是该种认定存在以下三个方面的弊端:其一,与《著作权法》的明确规定相冲突,存在法官造法的嫌疑;其二,在《著作权法》缺乏相应规定的情形下,侵权的嫌疑容易阻却TDM实施者的行为;其三,容易造成实践中判断标准的多样化,影响司法的公正性。

将以科学研究为目的的TDM行为纳入《著作权法》合理使用规范之中,作为一种独立的合理使用类型既具有理论上的合理性,也有国际经验可供参照,同时也是呼应我国人工智能发展战略和中央关于科学自立自强要求的重要立法措施。《著作权法》的第三次修改工作刚刚完成,而下一次修法的时机亦难以估计,但《著作权法实施条例》的修订工作正在进行之中。因此,根据新修《著作权法》第二十四条第(十三)项13的规定,可在《著作权法实施条例》的修订中增加以科学研究为目的的TDM合理使用规定。但从TDM在人工智能时代所具有的重要性以及普遍性来看,在时机成熟时,仍有必要将其纳入我国《著作权法》之中。

(一)以科学研究为目的的TDM版权例外的合理性探析

新技术的运用对于版权人来说存在两面性,即版权风险与版权扩张并存。如互联网技术的运用使作品的传播变得轻而易举,版权人一方面面临利益受损的局面,另一方面也在不断想办法获取这一新生领域所带来的版权利益。由此,信息网络传播权得以确立,其既是出于保护版权人利益的需要,也吹响了版权人向互联网领域进军的号角。而TDM技术的出现也同样为版权人提供了攻城略地的机会。他们所主张的“挖掘权”即是明证。但一项权利是否能为法律所确认,必须经过利益平衡的考量。无论是从我国《宪法》和《著作权法》所设置的利益平衡机制还是我国当前的现实发展需求来看,为科学研究中的TDM设置版权例外均具有合理之处。

其一,在著作权的“宪法进路”看来,著作权制度是一种中性制度,对著作权的限制与著作权本身同样重要,著作权的正当性应当建立在对宪法目标的实现上[17]。换言之,“宪法规定发展教育、科学和文化事业的国家义务和社会目标,是我国著作权法基本目标的宪法渊源”[22]。我国《宪法》既已为科学研究自由提供了最基础的保障,则著作权不应当成為实现该目标的阻碍。在不损害著作权人原有利益的情况下,对基于新技术而产生的新权利主张加以适当限制,是实现《宪法》利益分配的要求。TDM旨在对现有资料进行机器分析,并从中获得可供利用的知识。纵然其中涉及对作品或者其他内容的复制,其仅仅是该过程中无法避免的一个技术步骤。所复制的内容并非用于传播,因此不会造成对权利人的市场替代。而所涉及的改编、汇编、翻译等行为,也由于同样的原因不会产生损害权利人利益的后果。从另一个角度观之,若认为TDM属于版权人的专有权利,则势必严重阻碍科学研究中TDM的运用。进一步而言,《宪法》所赋予公民的科学研究自由实际上将无从保障,公共利益与私人权利的平衡将被打破。

其二,从《著作权法》的角度而言,“促进社会主义文化和科学事业的发展与繁荣”是赋予著作权人专有权利的目标之一14。保障公众对作品的接触、欣赏和学习是提升公民素质、促进再创作以推动社会文化和科学事业发展与繁荣的重要环节。可以说,作品、作者以至于著作权法均是因公众而得以存在,公众既是目的,也是动力和最关键一环。因此,著作权法在赋予著作权人专有使用作品权利的同时,也给予公众消费性使用15作品的权利,以实现著作权法的利益平衡设计。为学习、研究或欣赏等目的消费作品则是公众消费性使用作品的重要体现,其实质是获得作品的内容,包括隐含的思想或信息[22]。唯应注意的是,消费性使用应当以“合法取得作品”以及“合理使用作品”为前提[23]。在合法取得作品的前提下,仅以科研目的进行TDM是对作品的消费性使用而非传播性使用。而通常在取得作品的过程中,权利人已经实现了其回报。诚然,在TDM过程之中可能造成复制件外泄、发表的研究成果中利用了作品的表达等,但这不应当成为事先禁止科学研究中实施TDM的理由,应当依著作权侵权规则加以规制,即仅在相关后果产生侵权时才依权利人的主张对其加以禁止。

欧洲学界有观点亦认为,基于“思想和事实不受保护”的原则,任何旨在提取作品中所蕴含的思想和事实的复制行为均应当被允许[24]。该观点将TDM视作“机器阅读”的过程,并认为这与人类阅读是相同的,均是利用作品中的思想以产生新的知识。唯其不同之处在于,机器的阅读必须以复制为前提。若禁止该复制,则无异于禁止人们对作品中的思想和事实的利用。这与版权法的初衷是相违背的。思想/表达二分法大致划定了版权人的控制范围与公众行为自由之间的界限,体现了保护版权利益与公共利益之间的平衡。若不对版权人的这种权利主张加以限制,将打破这种平衡,缩小公有领域的范围,不利于实现版权法促进社会文化和科学事业发展的目标。

其三,增设以科学研究为目的的TDM版权例外具有高度的现实意义,符合我国当前的战略需求。十九届五中全会提出:“坚持创新在我国现代化建设全局中的核心地位,把科技自立自强作为国家发展的战略支撑”。人工智能作为21世纪三大尖端科技之一,其对于我国实现科技自立自强,建设科技强国的意义不言而喻。国务院印发的《新一代人工智能发展规划》指出:“人工智能是引领未来的战略性技术,世界主要发达国家把发展人工智能作为提升国家竞争力、维护国家安全的重大战略”。作为人工智能时代最重要和最基础的科学研究工具,TDM被普遍运用到自然科学和社会科学等领域,并创造了巨大的经济和社会价值。鉴于TDM在人工智能时代所具有的重要意义,其已成为国际上所普遍承认的一种科学研究自由,并体现在各国家和地区的立法中。我国欲实现人工智能发展的三步走战略16,实现科技自立自强,必须充分保障TDM在科学研究中的使用自由。而具体落实到版权法领域,则是应当破除当前我国《著作权法》对科学研究中使用TDM的制度限制。

(二)立法设计

基于TDM作为一种科学研究自由所具有的合理性以及我国当前的人工智能发展趋势和政策,笔者认为,我国《著作权法》第二十四条,即关于合理使用制度的规定亟须更新。具体而言,则是在第二十四条第(十二)项之后增加一项新的法定合理使用类型:

(十三)以科学研究为目的进行文本与数据挖掘,对合法获取的作品进行复制、翻译、改编、汇编。

1.该项合理使用应当限定为“以科学研究为目的”

《宪法》所规定的科学研究自由体现的是对公共利益的保障,也即为提升一国科研实力,促进国家科技、经济和社会发展而赋予公民的自由。以公共利益对私人所享有的版权权利进行限制有其充分的制度基础,且不会造成对权利人的过度损害。而“以营利为目的”实施TDM则暂时不应当纳入版权例外的范畴。一方面,大范围开放TDM版权例外,容易造成作品提供商提高授权许可费。实际上,若不将该版权例外限制在一个较为有限的范围内,权利人会默认所有交易对象均有进行TDM的可能,从而在定价时提高授权许可费,以弥补其预期利益的损失。另一方面,商业性的TDM需求巨大,而模式亦甚多,其更有可能对权利人形成市场替代,从而损害权利人利益。因此,限于科学研究为目的是多数国家的立法选择,而《DSM指令》也仅对此目的下的TDM版权例外作出强制规定。此外,该项合理使用不应当作主体上的限制。无论是国家设立的科研院所、高等学校,还是私人设立的研究机构,只要其是出于科学研究目的而进行文本与数据挖掘,其均属于《宪法》所规定的科学研究自由的范畴。以主体性质进行区别对待没有正当的理由。

2.该项合理使用应当以“合法获取”为前提

这一前提条件旨在实现TDM实施者与内容提供者之间的利益平衡。以付费换取接触作品或其他内容的权利是普遍的做法,也是版权法的基本逻辑。一方面,该例外旨在对抗内容提供者基于技术发展而无故扩张的版权主张(进行TDM的权利),并非要否定原有的制度(许可使用、技术保护措施等相关规定)。另一方面,专门为研究者提供数据集已经成为一种商业模式,这种商业模式的开展不仅需要付出一定的成本,而且也方便了研究的开展,为研究者所乐见。因此,合法获取这一前提条件具有其合理性。

3.《著作权法》第二十四条第一款构成了对该合理使用的内在限制

新修改的《著作权法》引入了合理使用“三步检验法”的内容,规定合理使用作品“不得影响该作品的正常使用,也不得不合理地损害著作权人的合法权益”。TDM的实施即使满足了该项合理使用的规定,但若依然可能产生与他人作品的正常使用相冲突或不合理地损害权利人合法权益的后果时,法官则可行使自由裁量权,以决定该行为是否可获得豁免。因此,该规定的引入实际上为该项合理使用设定了限制,有利于实现TDM实施者与版权人之间的利益平衡,避免制度的滥用和异化。

4.该项合理使用的行为类型包括“复制、翻译、改编、汇编”

从TDM的技术过程来看,对作品进行复制、翻译、改编以及汇编均是常见的操作,且通常是不可或缺的环节。其中,“复制”并不受数量上的限制。原因在于,在TDM技术过程之中,大量复制是必不可少的。更为重要的是,TDM过程中对作品的复制并不导致传播,不会为著作权人带来潜在或实际的替代效应。从更为本质的角度而言,这四种行为均是对作品内在思想的使用过程中所必要的步骤,属于消费性使用之列。退一步来看,即便在TDM过程中存在不规范的作品使用行为,若实际产生了对著作权人的市场替代,或者造成作品的传播等,也可依“三步检验法”的标准排除合理使用规则的适用,追究使用者的侵权责任。

结  语

版权与科学研究自由的冲突由来已久,其实质是科技发展过程中版权人利益与公共利益的动态博弈。科技自立自强须要充分的科学研究自由作为保障,而维护版权人的利益亦是促进社会文化和科学事业发展与繁荣的基石。TDM作为人工智能时代不可或缺的科研手段,对于实现我国人工智能战略和促进科技自立自强意义重大。豁免科学研究中的TDM版权责任,不会打破我国《宪法》和《著作权法》所设定的利益平衡,有利于实现科学研究自由,促进TDM的应用和发展。当前,国际竞争的主舞台已转移到科技领域。发达国家纷纷完善其版权制度,以实现其在人工智能领域的战略布局。响应十九届五中全会的号召,加快建设科技强国,完善科技创新体制机制,亟须谋求合理使用制度的更新和完善。

参考文献:

[1] 羅娇,张晓林.支持文本与数据挖掘的著作权法律政策建议[J].中国图书馆学报,2018,44(3):21⁃34.

[2] 何哲.通向人工智能时代——兼论美国人工智能战略方向及对中国人工智能战略的借鉴[J].电子政务,2016(12):2⁃10.

[3] 中国电子技术标准化研究院.人工智能标准化白皮书[EB/OL].(2018⁃01⁃24)[2021⁃3⁃14].http://www.cesi.cn/images/editor/20180124/20180124135528742.pdf.

[4] 罗森林,马俊,潘丽敏.数据挖掘理论与技术[M].北京:电子工业出版社,2013:17.

[5] European parliament.The Exception for Text and Data Mining (TDM) in the Proposed Directive on Copyright in the Digital Single Market ⁃ Technical Aspects[EB/OL].[2021⁃3⁃14].https://www.europarl.europa.eu/RegData/etudes/BRIE/2018/604942/IPOL_BRI(2018)604942_EN.pdf.

[6] Maximising the benefits of Artificial Intelligence through future⁃proof rules on Text and Data Mining[EB/OL].(2018⁃04⁃09)[2021⁃3⁃14].https://eare.eu/assets/uploads/2018/03/OpenLetter⁃to⁃European⁃Commission⁃on⁃AI⁃and⁃TDM_9April2018.pdf.

[7] 吴汉东.著作权合理使用制度研究[M].北京:中国人民大学出版社,2020:236.

[8] EUR⁃Lex.Directive (EU) 2019/790 of the European Parliament and of the Council of 17 April 2019 on copyright and related rights in the Digital Single Market and amending Directives 96/9/EC and 2001/29/EC (Text with EEA relevance.)[EB/OL].(2019⁃05⁃17)[2021⁃3⁃14].https://eur⁃lex.europa.eu/legal⁃content/EN/TXT/HTML/?uri=CELEX:32019L0790&from=EN.

[9] Future TDM.Baseline report of policies and barriers of TDM in Europe[EB/OL].[2021⁃3⁃14].http://www.futuretdm.eu/knowledge⁃library/?b5⁃file=2374&b5⁃folder=2227.

[10] 黄欣荣.大数据时代的哲学变革[N]. 光明日报,2014⁃12⁃03(015).

[11] AI+大数据,新冠肺炎知识智能服务应用大揭秘[EB/OL].(2020⁃05⁃13)[2021⁃3⁃14].https://mp.weixin.qq.com/s/l5hKnZykGtMBdAyM6uG⁃jQ.

[12] 沈阳,李洪磊,陈杰.图数据模型及其在疫情追溯领域的应用研究[J].软件导刊,2021,20(2):13⁃17.

[13] 张放,甘浩辰.疫情心理时空距离对公众情绪的影响研究——基于新冠肺炎疫期微博文本面板数据的计算分析[J].新闻界,2020(6):39⁃49.

[14] 杨娟.文本与数据挖掘合理使用例外规范的体系化设置[J].图书馆论坛,2020,40(4):141⁃150.

[15] 王德志.论我国学术自由的宪法基础[J].中国法学,2012(5):5⁃23.

[16] Campbell, Victoria.Authors Guild v. Google, Inc. [J].DePaul Journal of Art, Technology and Intellectual Property Law, 2016,27(1):59⁃72.

[17] 李雨峰.论著作权的宪法基础[J].法商研究,2006(4),112⁃120.

[18] European parliament.The Exception for Text and Data Mining (TDM) in the Proposed Directive on Copyright in the Digital Single Market ⁃ Legal Aspects[EB/OL].[2021⁃3⁃14].https://www.europarl.europa.eu/RegData/etudes/IDAN/2018/604941/IPOL_IDA(2018)604941_EN.pdf.

[19] European commission.Communication from the Commission to the European Parliament,the Council,the European Economic and Social Committee and Committee of the Regions[EB/OL].[2021?3⁃14].http://ec.europa.eu/newsroom/dae/document.cfm?action=display&doc_id=12526.

[20] 阮开欣.欧盟版权法下的文本与数据挖掘例外[J].图书馆论坛,2019,39(12):102⁃108.

[21] 李杨.著作权合理使用制度的体系构造与司法互动[J].法学评论,2020,38(4):88⁃97.

[22] 刘银良.著作权法中的公众使用权[J].中国社会科学,2020(10):183⁃208.

[23] 高富平.数字时代的作品使用秩序——著作权法中“复制”的含义和作用[J].华东政法大学学报,2013(4):134⁃149.

[24] Marco Caspers.A right to read for machines? Part I: The introduction[EB/OL].(2016⁃12⁃02)[2021⁃3⁃14].https://www.futuretdm.eu/blog/a⁃right⁃to⁃read⁃for⁃machines⁃part⁃i⁃the⁃introduction/.

The Construction of Copyright Exemption Rules for Text and Data Mining in the Era of Artificial Intelligence

Zhang Huibin, Xiao Qixian

(Civil and Commercial Law Department, Southwest University of Political Science and Law, Chongqing

401120, China)

Abstract: The freedom of scientific research is a fundamental right granted by China's Constitution, which guarantees that researchers are free from unnecessary restrictions in their scientific research, thus contributing to the development of science and technology. In the era of artificial intelligence, text and data mining, as a basic scientific research method, has become a new type of scientific research freedom. From the perspective of Chinese legal system, text and data mining is severely restricted by the copyright legal system, and there is a huge risk of copyright infringement. From the perspective of comparative law, exempting the copyright liability for text and data mining in scientific research is a trend in the development of copyright legal systems in various countries. Although the third revision of Copyright Law improved the fair use system and considered the needs of scientific research development to a certain extent, it was generally unable to meet the needs of the era of artificial intelligence. Referring to the provisions of Article 3 of the European Union's Copyright Directive of Digital Single Market (2019), the addition of "fair use of text and data mining for the purpose of scientific research" is of great significance to ensure the freedom of scientific research and to achieve science and technology self?reliance and artificial intelligence strategy in the era of artificial intelligence.

Key words: text and data mining; freedom of scientific research; fair use; revision of Copyright Law

猜你喜欢
合理使用
Google Library十年版权之争终获合法判决的经验借鉴
数字版权管理与合理使用权利冲突的解决路径
信息自由与版权法的变革
室外艺术品原作者署名权的行使规则案例分析
论对音乐作品的著作权保护
新闻版权合理使用制度的反思与重构
临床药师参与中药注射剂合理应用的研究
浅谈美术课堂教具的使用
滑稽模仿作品的合理性法律分析