论人工智能生成物在著作权法上的定性

2019-03-22 02:41刘健

传播与版权 2019年6期

刘健

（华东政法大学，上海 200042）

人工智能的概念早已有之，近年来，随着数据量的爆发、算法的改进与硬件技术的发展，人工智能技术迎来了新一轮繁荣。①从个性广告投放到机器翻译、图像识别、自动驾驶，人工智能技术逐渐渗透到日常生活的各个领域。在给人类带来便利的同时，一些号称是人工智能生成的“作品”也开始出现在公众视野，如人工作智能写诗②、作画③、作曲④。这些生成物既不是由人类直接创作，也不是由人借助计算机工具辅助创作，而主要是机器自行生成的。单从外在表象来看，这些生成物与人类创作的作品难以分辨，甚至同人类创作的作品一样给我们带来美的享受。以人工智能作曲为例，分析提取肖邦创作的乐曲的音乐特征，并据此生成的模仿肖邦音乐风格的马祖卡舞曲，几乎可以骗过专业人士的耳朵。⑤这些内容正在并将持续给文化、艺术领域注入新的血液，预示着无限的可能性。

受制于著作权法对创作主体的要求，这些生成物在当下难以作为作品获得著作权法保护，由此引发了人工智能生成物可版权性的讨论。对于该问题，学界存在多种不同见解，既有学者认为人工智能生成物只是应用算法、规则和模板的结果，并不属于创作，不能体现创作者独特的个性，不能被认定为作品。⑥也有学者主张由机器人独立完成的“作品”，可受著作权保护。⑦笔者认为，不考虑作品必须由人类创作的要求，判断人工智能生成物是否可以构成作品，关键是判断人工智能生成物是否具有独创性。若其不具有独创性，则难以作为作品受到保护。而从产业发展的角度上来说，是否应当对人工智能生成物给予特别保护，需结合当前的著作权法实践与产业实践来回答。

一、独创性不能仅依据外在表达来判断

著作权的权利客体是作品，而作品需属文学、艺术、科学领域内具有独创性的表达。人工智能的生成物，仅从外观上看与人类创作的作品难以分辨，因此在实际生活中会被当成作品对待不足为奇。有学者据此认为人工智能生成物应当作为作品受到保护，认为“著作权法只能依据展现在外的表达判断是否具有独创性，无法察知创作者的真实意图和想法，作者是如何把作品创作出来，更不是著作权法调整的范围”。⑧“假设同一成果是由人类创作的，能够被认定为具有独创性，那么，若同一成果是由人工智能生成的，在不考虑该成果所源自的主体身份这一前提下，其独创性亦应被认可。”⑨上文中的学者均将独创性视为客观外在标准，认为可通过人工智能生成物的“作品”外观而认定其具有独创性。笔者认为，独创性的判断不能依据外观，而应探求生成物的生成过程。只有其生成过程属创作，人工智能生成物才能具有独创性因而成为作品。

首先，我国及世界其他主要国家的著作权法均要求在判断智力成果是否具有独创性时需考虑其产生过程是否属于创作。只有具有“独创性”的外在表达才能成为著作权法意义上的作品。⑩伯尔尼公约并未对独创性一词作出定义，仅仅是罗列受保护的作品类型，而将独创性的定义或者标准留给各个成员国自行确定。[11]而无论是我国还是世界其他主要国家，在考虑智力成果是否具有独创性时都需要考虑其产生过程，只有智力成果的产生过程属于“创作”，才会具有“独创性”因而成为作品。

我国著作权法在定义作品时并没有使用“独创性”一词，而是通过对“创作”一词的界定来体现对独创性的要求。“本法所称的作品，包括以下列形式创作的文学、艺术和自然科学、社会科学、工程技术等作品”“创作作品的公民是作者”[12]，在这些表述中均未出现“独创性”一词，只出现“创作”一词。而《著作权法释义》中，明确著作权的客体“必须属于创作，而不是抄袭。有的称为必须具有独创性、初创性或原创性……著作权法所称的作品必须是自己创作的，而不是从别人的作品中抄袭来的。所谓创作，是指文学、艺术和科学作品的创造，即作者通过对政治、经济、文化和其他社会生活进行观察、体验、研究、分析，并对社会生活的素材加以选择、提炼、加工，运用自己的构思、技巧，塑造出艺术形象或表述科学技术的创造性劳动”。[13]由此可见，我国著作权法在创作一词中体现了对独创性的要求，要去考量作品是否具有独创性，是否能受到著作权保护，就必须考虑作品是否是“创作”出来的，即必须考虑作品产生的过程。我国法院在实践中亦认可判断独创性需考虑创作过程。例如，在歼十模型案中，最高法院认为：“独创性指作者在创作作品的过程中投入了某种智力性劳动，创作出来的作品具有最低限度的创造性，且作品是由作者独立思考并独立完成的，体现了作者的精神劳动和智力判断”。[14]在某起美术作品著作权纠纷中，上海知识产权法院认为“从韬图公司作品的创作过程及其表达形式看，该作品确实包含了作者的选择、判断，具有作者本人的个性，因此，韬图公司作品具有一定的独创性，符合美术作品的构成条件，应受著作权法保护”。[15]

大陆法系国家如德国在著作权法立法中也使用创作一词，德国著作权法规定“著作仅指个人的智力创作”[16]，通过“创作”一词来体现对独创性的要求。美国版权法的立法基础是美国宪法，但美国宪法中并未出现“独创性”一词，国会制定的版权法中虽然使用了“独创性”一词但也未对其进行界定，最高法院通过判例将独创性解释为“独立完成”且“包含最小程度的差异”，从字面上看并未强调创作过程。但是，美国版权局将“在没有任何源于人类作者的智力投入或参与的情况下，由机器以及随机或自动运行的纯粹机械过程生成”[17]的成果排除出可登记范围，这种强调仅仅机械化的随机过程不可以产生作品，也体现了对智力成果产生过程的考虑。由此可见，无论是我国还是世界其他主要国家，在考虑是否具有独创性时都需要考虑作品的产生过程，只有智力成果的产生过程属“创作”，才会具有“独创性”因而成为作品。

其次，著作权法以创作体现对独创性的要求有其内在合理性。客观外在标准在判断独创性时，不必考虑创作意图、过程等中间要素，而仅仅关注我们对最终成果的一般感受，看似简单，实际上割裂了作品与作者的逻辑关联。享有著作权的是作者（以及受转让的人），我们不能脱离作者（权利人）去谈论著作权，也不能脱离作者去谈论作品。而将作品与作者联系起来的正是“创作”，作者在创作中赋予作品独创性，使其获得保护。因此，脱离创作过程，仅仅根据外观讨论独创性是无源之水。即使我们仅仅根据外在表象认为其构成作品，在考虑谁是作者的时候，也必须考虑是谁进行了创作。只有考虑创作过程，才能发现独创性是谁赋予的，赋予独创性的人因此成为作者。借助计算机辅助创作产生的作品，其作者之所以是人而不是计算机，正是因为创作过程虽然使用了计算机，但赋予作品独创性的是人的选择和判断而不是机器的计算过程。

独创性中的“独”必须考虑产生过程，若不考虑产生过程，仅仅根据外观判断，则独立创作但与他人先前作品实质相似的作品就会被认为属于复制而无法获得单独的版权，将著作权法对“独创性”的要求等同于专利法上对“新颖性”的要求。独创性的“创”也要求考虑作品产生过程。在客观上有作品的外观，但实际上并非通过“创作”产生，著作权就无从谈起。假设某位画家在作画时不小心将颜料倾倒，竟形成了某幅泼墨“作品”。若作家在该“作品”上署名并对外声称是自己创作完成，在现实中很可能受到著作权保护。但对该“作品”予以保护与著作权法的本意相悖。一是这个过程并没有体现作家的个人思想、情感，没有人格要素的体现，难以符合大陆法系著作权理论。二是美国版权法的立法目的主要是给予作者奖励而激励作品创作、传播，以促进文化、艺术、科学领域的繁荣，其激励针对的自然不是这种偶然的机械过程。

在过去，这种通过偶然或者机械过程产生“作品”的情况较为少见，但计算机的使用使得通过机械过程产生“作品”变得容易。例如，刘慈欣的小说《诗云》里有一个例子，利用计算机程序存储所有汉字，并输出所有五言古诗的组合，使得所有五言古诗都被“创作”出来。这样的程序，可以轻而易举地输出“床前明月光，疑是地上霜”的诗句。采用类似的方法，计算机也可以输出莎士比亚的十四行诗。用这种方法写成的诗歌在外观上看似具有独创性，但其实只是另一种使用“额头流汗”方式产生的劳动成果而已，与其说是创作，不如说是发现。即使输出结果无法由设计者事先预测，也不一定能体现独创性。比如将贝多芬的音乐分割成一个个小单元，并按照某种预先设定好的样式随机输出。每次产生的结果都不同，在结果中可能有一些不错的生成物，但这样的生成物同样不具有独创性，属于发现，而非创作。

最后，推定署名者为作者以及著作权法上法人作品的存在是程序法或法律政策的需要，无法改变作品通过创作产生的本质。之所以在实践中不考虑创作过程而根据作品外观判断是否享有著作权，仅仅是根据生成物具有作品外观而推定署名者“创作”了该“作品”，因而享有著作权，并非作品本身的应有之义。同时，将电影作品著作权赋予制片者，将法人或者其他组织视为作者，只是出于政策和利益平衡上的考量，电影作品和法人作品的独创性最终还是自然人在创作过程中赋予的，与人工智能的生成物存在本质的不同。18

二、人工智能生成物未体现独创性

类人甚至超人智能的出现将对人类生活和社会体制造成重大影响，法律也会相应发生巨大变化。从当前科学进展来看，这类人工智能的出现还遥遥无期，过早讨论没有太大实际意义，因此本文的讨论仅限于当前及将来短期内的人工智能。

对其进行讨论时，首先要将当前人工智能生成物与利用计算机辅助创作的作品作一个区分。后者早有定论，而前者是在近年新出现的或者在近年来才得到较大发展的，主要指利用深度学习技术生成的“作品”。深度学习是人工智能的一个子概念[19]，其特征在于模仿神经网络的多层次信息传递特点，利用训练数据集，根据某种特定算法求得参数，并且可以通过增加训练或者自我博弈等方式不断优化参数，从而模仿人类的“学习”能力。对于“学习”，Mitchell（1997）提供了一个简洁的定义：“对于某类任务T和性能度量P，一个计算机程序被认为可以从经验E中学习是指，通过经验E改进后，它在任务T上由性能度量P衡量的性能有所提升。”[120]以常见的监督学习为例，典型的过程是给计算机一组训练数据，随着数据的输入计算机不断地按照预先设定的算法（BP算法）自行修正参数，在数据间所有可能的函数关系中，找出拟合度最好，同时一般也是最为简洁的函数关系。[21]与传统的专家系统[22]相比，其区别主要在于参数是人为设定，还是自行设定。当然所谓自行设定，并非随意设定，只是机器根据某种预先设定的统计学方法，利用数据集，通过“学习”设定。

大部分人工智能生成物，如机器翻译、作曲、写诗等，都是通过一种称为神经循环网络（RNN，深度学习的一种网络形式）的方式实现的。以机器写作为例，若要写成一篇莎士比亚文风的作品，典型的方法是将莎士比亚的作品输入人工智能系统作为训练数据，分析确定莎士比亚作品中词汇的概率分布，如求得给定前一个或者多个词语后，紧随其后出现的词语的概率分布。获得概率分布后，通过随机采样即可生成一篇“莎士比亚文风”的作品，理论上这样的文章可以有无数篇。模仿肖邦风格的音乐作品也类似，其过程简单来说就是先将肖邦的作品分解，再重新组合成新的“作品”。当然，这只是一种粗糙的方式，实际上有许多改进方法使得生成的成果更贴合人类作品。

这种先学习再生成的过程，虽然强大，并且出人意料，但并没有多少“智能”可言，只是一个利用数据不断优化参数的过程。这些计算过程理论上由人类也可以完成，只是会花费漫长时间而变得实际不可能。实际上完全是“额头流汗”的再现，并且也不是企业或者程序员在劳动，因为程序完成后，只需要数据来训练，电力来维持运转即可，生成物的产生过程没有任何创造性的劳动，与著作权法要求的创作大相径庭，因此也不具有独创性。

著作权法所要求的独创性，是作者在创作过程中赋予作品的。创作过程同机械化的生成过程完全不同，在一定的创作空间下，作者通过判断、取舍将创作空间填补，并在判断和取舍中体现了作者的思想和情感。这个过程中既有深思熟虑，又有灵感火花的偶然迸发，甚至有些时候是无意识的，但即使无意识中也隐藏着一个人的深刻个性。作者的作品是其思想和情感的反映，同一作者的不同作品，常常既相互区别又具有独特的统一风格。诚然，人工智能在学习过程中也有取舍，但这种取舍是预先设定的实现，与人类在创作中的取舍不同。人类在创作作品时，一些人能从人尽熟知的意象中迸发出天才的火花，一些人另辟蹊径关注到完全不同的意象。但如果没有预先设定选择方式，人工智能通常对于出现频率较高的东西会加以较大关注。例如，分析全唐诗，发现“月”的出现频率高，而“酒”又常常与其相伴而生，因此人工智能可以生成描写对月饮酒主题的新诗，无法脱离前人意象，但人类的创作可以产生“人生代代无穷已，江月年年只相似”这样开辟新境界的诗句。人类因其智力、个性、经历差异而在创作中有不同的选择、判断，这种差异既是人格的独特反映，又为文化、艺术领域贡献新的宝藏，而现阶段人工智能只是依据程序和数据实现对既有材料的复刻。

人工智能这一称谓容易让人产生误会，觉得机器与人具有一样的智能。但实际上当前的人工智能（主要是指使用深度学习技术的人工智能）和真正的人类“智能”并没有太大关联，使用神经网络这个词仅仅是因为其信息传递和分层结构类似于人类的神经网络。人工智能的参数是利用统计学方法分析训练数据来设置并优化的，与人类实际的信息处理方式不一定类似。对于人的学习、思考方式，现代科学尚未给出回答。当然，人的思考方式也许并不比人工智能更高明，人的创作过程也涉及对前人的学习，所谓“自由意志”也许也只是人的体内另一套复杂的机械过程而已。但至少在短期内，人工智能的生成物的产生方式尚且过于简单，很大程度上只是对人类既有智力成果的拆分和重组而已，因此也无需在当前引入形而上学的争辩。

三、当前并无特别保护的必要

人工智能产业确有发展的必要，人工智能的生成物也体现出无限的可能性，因此有学者从产业发展的角度主张应给予其著作权保护。[23]但一是不应破坏著作权法原有体系认为人工智能生成物构成作品，这在前文已有论述。二是著作权法只保护人类的智力成果是否会对这一产业造成阻碍，尚且存疑。

当前人工智能生成物在理论上难以获得著作权法的保护，但在实践中，人工智能生成物完全可以作为作品而实际受到保护。在企业或者具备专业知识的个人掌握人工智能技术的当下，客观上与人类作品无法区分的人工智能生成物完全可以通过企业或者个人的名义发布，而实际受到著作权法保护，同时也与一般作品一样经受市场的挑选。如果人工智能的生成物确实具有极大的市场价值，其市场价值是由于“作品”本身的价值，而非人工智能这一流行概念的附加价值，则著作权法实际上已经给其开发者提供了足够的激励。在这一激励下，开发者开发出能生成满足市场需求“作品”的人工智能技术，从而繁荣文化、艺术市场，实现著作权法的立法目的。而若著作权法回应所谓产业需求，在立法上对人工智能生成物给予保护，则其保护程度也必然不会超过当前对作品的保护。科技公司和专业人员掌握技术的事实，会使得著作权法的回应仅仅具有宣示意义而缺乏实际意义。若人工智能生成物本身具有巨大的商业意义，而著作权法给予其保护少于一般作品，则科技公司和专业个人为实现利益最大化依然会选择将其以法人或者个人名义投入市场。

在当下，将人工智能生成物认定为作品的现实意义可能仅仅在于使企业因此获得更多的融资，或者产品获得更好的售价。这虽然在一定程度上有利于该产业的发展，但其收益远小于破坏著作权法原有体系所带来的巨大负面影响。如需单独保护，通过新设邻接权等不破坏著作权法原有体系的方式来保护可能是更好的选择。但是，正如上文所说，若其保护范围小于作品著作权，则科技公司和专业个人依然会选择将具有潜在市场价值的生成物以法人或者个人的名义发表，从而将其实质上变成作品来保护。因此，若相关产业主体希望其人工智能生成物获得著作权保护，既不必破坏著作权法原有体系将人工智能生成物认定为作品，也不用新设邻接权才能实现。为促进人工智能产业的进步，更具价值的立法保护也许是对人工智能利用数据（其中可能包括作品）而产生的知识产权纠纷，如侵犯复制权、改编权等纠纷给予一定程度的豁免，毕竟数据的自由使用对人工智能（尤其深度学习）的发展至为关键。

不能否认未来有一天，人工智能可能会如同人类一样思考、感受。当然，和人类一样思考并不一定是获得保护的必要条件。人工智能也许会产生一种全新的创作作品的方式，有些创作背后确实蕴含着一些机理，比如巴赫的音乐体现出严密的数学特征，人工智能可能更容易实现。这种“创作”方式的创新也许可以产生人类无法完成的杰作，给文化、艺术领域带来前所未有的繁荣，如同哈勃望远镜使得我们发现了更浩瀚的宇宙一样，人工智能也使得我们发现了文化艺术领域更浩瀚的宇宙。但在当下，这些可能性尚不存在，仍需遵循著作权法的原有体系去考虑人工智能的生成物是否具有独创性。在技术日新月异的今天，若著作权法仅为了迎合产业呼声而破坏其原有体系肆意修改，则将失去其作为法律应有的稳定性和权威性。

注释：

①参见吴恩达等：《Neural Networks and Deep Learning》，来源：https://www．coursera．org/learn/neural-networks-deeplearning?specialization=deep-learning，2019年3月15日访问。

②参见北京青年报：《人工智能“少女诗人小冰”上线AI新技能“看图写诗”》，来源：http://media．people．com．cn/n1/2017/0707/c40606-29388857．html，访问日期2019年3月15日。

③参见艺术国际网：《人工智能创作艺术会不会成为下一个伦勃朗》，来源：http://art．people．com．cn/n1/2016/0412/c206244-28270628．html，访问日期2019年3月15日。

④人工智能作曲实例，来源：http://aiva．ai/about，http://artsites．ucsc．edu/faculty/cope/experiments．htm，访问日期2019年3月15日。

⑤参见候世达：《如聆巴赫》，来源：http://blog．jjgod．org/2008/11/22/sounds-like-bach/，访问日期2019年3月15日。

⑥王迁：《论人工智能生成的内容在著作权法中的定性》，载《法律科学》2017年第5期。

⑦吴汉东：《人工智能时代的制度安排与法律规制》，载《法律科学》2017年第5期。

⑧[23]李伟民：《人工智能智力成果在著作权法的正确定性——与王迁教授商榷》，载《东方法学》2018年第3期。

⑨陶乾：《论著作权法对人工智能生成成果的保护——作为邻接权的数据处理者权之证立》，载《法学》，2018年第4期。

⑩王迁：《知识产权法教程》，中国人民大学出版社2016年版，第25页。

[11]See COPYRIGHTABILITY OF ARTWORKS PRODUCED BY CREATIVE ROBOTS AND ORIGINALITY:THE FORMALITY-OBJECTIVE MODEL, Minnesota Journal of Law, Science & Technology, 2018．

[12]《中华人民共和国著作权法》第三条、十一条。

[13]胡康生：《中华人民共和国著作权法释义》，法律出版社2002年版，第13页。

[14]最高人民法院（2017）民再353号民事判决书。

[15]上海知识产权法院（2017）沪73民终159号民事判决书。

[16]《十二国著作权法》组：《十二国著作权法》，清华大学出版社2011年版。

[17]See U．S．C OPYRIGHT OFFICE, COMPENDIUM OF U．S．COPYRIGHT OFFICE PRACTICES (THIRD )§ 313．2 (3d ed．2014)，译文使用了王迁教授的翻译，见前引6。

[18]该段主要是对前文作者（前引8）其他观点的反驳。

[19]深度学习是机器学习的子概念，而机器学习又是人工智能的子概念。

[20]参见deeplearing，MIT，http://www．deeplearningbook．org/，此书中文版参见github开源社区合作翻译版。

[21]Lecun Y, Bengio Y, Hinton G．Deep learning[J]．Nature,2015, 521(7553):436．

[22]指的是由该领域专家预先设定参数，机器执行的系统。