科学数据确权研究

2023-02-07 11:26高依旻
中国科技资源导刊 2023年4期
关键词:知识产权科学

高依旻 樊 博 孟 勇

(1.河海大学图书馆,江苏南京 210098;2.水利部科技推广中心,北京 100038;3.南京大学图书馆,江苏南京 210023)

0 引言

自科学研究方法诞生以来,研究人员都需要收集实验性证据[1]。作为科技活动记录的实验性证据,又被称为科学数据。科学数据既是记录科技活动、凝聚科技智慧的阶段性科技成果,又是科技创新活动的重要研究对象。科学数据赋能科技创新,能够支撑实现高水平科技自立自强,能够提升科学数据全球影响力和服务能力。当前,我国正处于向科技强国迈进的重要历史机遇期。在这个历史机遇期,要全面提升我国科学数据治理与利用水平,就要着力增强科学数据对国家重大战略需求的支撑保障能力。近年来,随着越来越多的科学装置的建设和重大科学实验的开展,国内的科学研究也进入了前所未有的大数据时代[2]。大数据研究的核心内容就是从大量的异构数据中提出新问题,也就是科学数据的重复利用。2018 年,我国颁布的《科学数据管理办法的通知》,对科学数据进行规范和管理。可是科学数据的重复利用尽管受到国家层面的重视,但依然有种种壁垒阻碍了科学数据的开放共享。

在国外,对科学数据共享的研究主要有政策研究,尤其是从实证的角度,分析不同层次机构政策对科研活动的影响。此外,还有对共享意愿的研究,对数据拥有者的共享意愿进行调查分析等。荷兰代尔夫特理工大学科学数据收集调查显示:有46%的受访者认为“未能以正确的方式整理数据”是科学数据共享的壁垒之一。其中,有37%的受访者认为其原因是“不确定版权和使用许可”,有26%的受访者认为“没时间去存储数据”。由此可见,科学数据共享的壁垒包括:缺乏科学数据管理机制,以及数据创造者缺乏共享的意愿。科学数据创造者的共享意愿在很大程度上取决于创作者是否受益[3],而创作者受益与数据的知识产权权属有关。

在国内,对科学数据共享的研究主要集中在共享模式、共享政策、共享考核标准、知识产权等方面。阮冰颖等[4]针对科学数据的管理提出了一系列措施,如提高数据质量和评价考核标准等。盛小平等[5]则提出明确与尊重数据主体权利是实施科学数据开放共享的前提,在当前科学数据开放共享实践中,数据权属并不明确,存在数据确权、数据侵权、数据维权3 个方面的数据权利问题。综上所述,国内外学者均认为科学数据共享的壁垒之一是科学数据确权。由于科学数据产生的过程涉及多个创作者,利益关系复杂,现有的知识产权相关法律不足以解决其矛盾,促进科学数据的共享。因此,本文将对科学数据的确权问题进行分析,运用马克思主义地租理论研究科学数据权在多个主体之间的分配。首先,运用现有法律对科学数据确权的适用性进行详细分析;然后,探讨科学数据权属界定的原则,并对科学数据权在多个主体之间的分配进行讨论;最后,对整个研究进行总结。本文的研究结果希望能够为科学数据确权问题提供全面而深入的分析,并为解决相关问题提供一些有益的思考。

1 科学数据确权的现状

科学数据确权是科学数据共享的壁垒之一。但是,目前科学数据的共享还比较少,因此产生的纠纷比较少,社会实践中产生的共享矛盾还不突出。而大数据在商业上应用广泛,数据权属不明确已经导致众多的商业纠纷。因此,分析相关的商业纠纷,可以为科学数据的共享提供借鉴。

在最高法院网上,以关键词“知识产权”+“大数据”进行检索,检索得到法律文书919 篇(检索时间为2021 年12 月28 日)。其中不乏涉及数据权属的。如在一起大数据产品的纠纷案中,原告为淘宝(中国)软件有限公司,被告为安徽美景信息科技有限公司。原告认为被告在电商平台运营中,非法利用了原告开发、运营的涉案数据产品牟利。法院认为被告据他人劳动成果为己用而牟利的行为,有悖公认的商业道德,属于不劳而获的“搭便车”不正当竞争行为,如不加禁止,将会挫伤大数据产品开发者的创造积极性,阻碍大数据产业的发展[6]。又如2009 年,大众点评网起诉爱帮网使用源自大众点评网的商户简介和用户评价,侵犯了自身的权益。法院认为网友点评文字在大众点评网上是按时间顺序排列,没有证据证明网站对其进行了选择。这种排列方式没有创造性,不满足著作权独创性的要求[7]。这两起案例虽均涉及数据的权属,但其表现不同,受到法律的保护程度也不同。从这两起案例可知,只有被法律认可的智力成果,才能受到法律的保护。

科学数据属于智力成果,智力成果需要通过知识产权制度进行规范和引导[8]。就法律层面而言,数据权利之构建是维护信息安全秩序的制度基点。然而于法学理论上,数据权属理论呈百家争鸣之势[9]。

2 法律对科学数据产权的保护

《中华人民共和国民法通则》中规定了6 种知识产权类型,即著作权、专利权、商标权、发现权、发明权和其他科技成果权。保护知识产权的法律有著作权法、专利权法、商标权法、商业秘密权法、反不正当竞争法等。

2.1 知识产权的起源

知识产权制度是罗马法“财产非物质化革命”的制度创新产物[10]。知识产权在资本形态上表现为无形资产。《国际评估准则》(2001 年)将无形资产定义为“是以其经济特性而显示其存在的一种资产,无形资产不具有实物形态,但为其拥有者获取权益和特权,而且通常为其拥有者带来收益”。财政部颁布的《资产评估准则——无形资产》(2001 年)将无形资产表述为“特定主体所控制的,不具有实物形态,对生产经营长期发挥作用且能带来经济利益的资源”[11]。

无形资产不具备实物特征,其中知识类无形资产又称为智力财产,主要包括知识、技术、信息等。这类无形资产的特点是复制和传输成本几乎为零。因此,无形资产无法用有形资产的财产权进行保护。它的主要权利要求是独占性,也就是权利人可以禁止他人使用,因此设立知识产权法予以保护[11]。知识产权是“以专属支配权为本质的知识资产”[12]。

知识产权是法定无形资产的基础。没有知识产权,就不会有法定无形资产,但是有了知识产权,并不必然成为法定无形资产。无形资产实现其价值就必须参与到生产中,形成一种生产关系。只有进入生产领域的知识产权,才能成为企业可利用的无形资产[12]。无形资产为一个主体所拥有的在较长时间内可以持续使用并为主体带来超额经济收益的独特的无形资源或要素[13]。其含义为,无形资产是在生产中产生垄断性的知识产权,对产品起到增值效用。

马传兵[14]认为,无形资产中的知识产权在生产领域,可以和劳动一起形成新的价值。无形资产既是劳动成果,又能与新的劳动结合,产生新的价值。因此,知识产权表现出资本的属性,允许权力人对其独占。

2.2 现有知识产权法对科学数据权保护的适用性

科学数据中的单个数据的价值几乎为零,其价值在于众多的数据按照一定的规则排列继而被利用。知识产权法中的著作权法、商业秘密权法和专利法对科学数据保护有一定的适用性。

在著作权法中,著作权保护的独创性是指形成独立表现思想的内容,并不意味着具备唯一性,只需要独立完成即可。因此,著作权法比较适合对科学数据的保护。在对科学数据进行保护时,可以采用著作权中的汇编作品保护条款。汇编作品保护的作品一般是无法归类到著作权保护的9 类作品的其他作品中,具有“兜底”的作用。科学数据可以归属于汇编作品。

根据法律的定义,商业秘密持有人的定义是指依法控制商业秘密的人。这个概念界定避免了关于界定数据权的法律争论,简化了数据价值周期中参与者的角色,提供了高度的法律确定性[15]。

专利权是指政府根据设计人或发明人的申请,向社会公开发明创造的内容,这个发明创造的内容符合法律规定,根据法定程序在一定期限内授予发明人或设计人的一种排他性权利[16]。政府的专利管理机构向社会公开其发明特征,并对此特征进行保护。职务发明专利的创作主体产生与科学数据比较相似,均可以由机构、个人共同成为权利人,其目的也是为了向社会公开,发挥更大的价值。

2.3 现有知识产权法对科学数据权保护的局限性

目前,知识产权法对科学数据权的保护并不完全适用,依然存在以下不足。

(1)著作权中的汇编作品与科学数据在知识产权保护方面不相适应:一是汇编作品是对他人的作品按照一定的方式组合,可以追踪到作品的原作者。按著作权法的规定,汇编作品的选择和编排上需要体现出独创性[17]。科学数据则属于大数据,数据源很难识别,且科学数据的价值并不体现在数据的编排方式上,其编排方式是否具有独创性并不与其价值正相关。二是著作权作为一种排他性权利,应用上限制较多,如标明出处等。可是科学研究则需要自由地摘录引用科学数据。

(2)利用商业秘密权法对科学数据进行保护具有一定的优势,但是处于秘密状态的数据价值难以确认。更关键的是,在大数据环境下,数据的价值来源于数据的自由流动,处于秘密状态的数据显然是无法参与到数据的自由流动中去的。

(3)专利权保护方式有利于科学数据的价值识别和流通,但需要提出独立的权利要求,也就是申请权利保护的技术特征。科学数据很难总结其技术特征,由此提出权利要求。因此,专利法对科学数据的知识产权保护应用也有局限性。

2.4 科学数据确权需要解决的核心内容

科学数据权是为了保护数据创作者利益,促进其创作积极性;科学数据的共享和复用是促使用户使用已有的科学数据,避免为获取相同的数据而进行重复实验,使社会以较小成本获得较大的科技进步。

科学数据确权,一方面可以促进科学数据创作,另一方面可以推广数据共享和复用,促进社会效益最大化。确权的内容可以分为两个层面:科学数据是否具备知识产权,以及知识产权在多个创作者之间如何分配。

科学数据往往由多个主体共同创作完成。当科学数据的投资主体是国家或者政府时,根据政府投资所占份额(完全投资或者部分投资)和委托单位的性质(盈利或者非盈利)的不同,应采取相应的产权形式,激励科学数据创造者的生产活动[18]。

在科学数据中,有部分数据涉密,而这些涉密的数据不属于本文讨论的范围。除涉密数据外,政府委托非盈利性的大学、医院、科研单位进行科学实验所产生的科学数据及数据产品,理论上应实行“完全开放”的共享机制。然而,即使应当完全开放,依然会有很多的障碍成为科学数据共享的壁垒。政府委托盈利性机构在进行科学实验时所产生的科学数据则需要依据事先约定的协议执行,一般使用原则是公开有偿使用。研究科学数据确权是为了有效提高社会整体科技效率,且符合社会伦理。因此,本文仅对非涉密的科学数据进行确权研究。

科学数据确权存在以下2 个核心内容:一是科学数据权的界定。科学数据属于无形资产,应受到知识产权法的保护。并非所有的科学数据都能够获得数据权。因此,需要对科学数据的特征分析,确定科学数据权界定的原则。二是科学数据权的分配。由多个主体共同创作而成的科学数据,其权利必须妥善分配。既要有理论的依据,又要促进创作者的积极性,提高社会整体科技效率。

3 科学数据权的界定

知识产权法中的知识类型,均需要辨别是否属于保护范围。保护范围的界定方式一般有两种:一是从形式到内容全部进行保护;二是鉴别所保护内容的独创性。科学数据的价值不是形式,而是来自海量数据和编排方式,确权的目的是为了再利用。第一种保护方式不适合科学数据。第二种保护方式需要确定其独创性,科学数据的独创性不易归纳,因此需要另辟蹊径界定其具备知识产权的方法。下面从获取数据权的实践、获取数据权的理论依据、获取数据权的原则3 个方面探讨科学数据权的界定问题。

3.1 获取数据权的实践

文杰[19]认为,在我国台湾地区,根据“著作权法”的规定,数据库独创性的认定标准是“资料的选择及编排具有创作性”。《WIPO 版权条约》规定“数据或其他资料的汇编,只要由于其内容的选择或排列构成智力创作,其本身即受到保护。陈少宏[20]认为,美国曾经采取“挥汗原则”或者说“勤勉原则”,认为汇编人付出劳力与投资,因此汇编作品应当受到著作权法的保护[2]。也有人反对“挥汗原则”,认为必须有独创性,否则临摹一幅画,尽管付出努力,但也不是原创,不应该具有知识产权。但是各种规定都没有统一的尺度,往往有赖于数据库汇编者主观的价值判断。上述文献将大数据划分为内容和编排形式两部分。有人认为两者均需要有独创性,而有人认为只要有一个能够满足独创性即可。

3.2 获取数据权的理论依据

知识产权立法的目的是为了保护知识产权人所拥有的无形资产带来的利益,而利益是由提高现有劳动生产率而产生的,也就是马克思主义政治经济学中的剩余价值,就是知识产权存在的依据是存在提高社会生产率的可能性。科学数据的复用亦是如此。

科学数据的复用是科学数据的核心价值来源[1],离不开其创造者充分公开科学数据的收集、分析、整合等技术方法。数据创作者公开技术方法涉及自身的竞争优势[21]和创作积极性。提高创作者的积极性和公开性必须确保创作者的权利。知识产权制度掩藏在促进创新的神圣外衣下的代价是容忍知识产权人有条件地、在一定期限内对创造性劳动者和整个社会的知识剥削[22]。

《剩余价值论》指出,“再生产科学所必要的劳动时间,同最初生产科学所需要的劳动时间是无法相比的”[23]。生产者通过极大提高劳动生产率使自己商品的个别价值低于社会价值,而从中获得超额剩余价值。如果生产者利用其稀缺性人为地限定价格,则超额剩余价值转化为垄断利润。

知识产权制度通过赋予知识产权人在一定期限内的垄断性权利,使其享有对其拥有的知识产品的排他性权利。这项制度也限制了其他模仿者未经授权的复制、传播和使用,因此也阻碍了社会劳动生产率的普遍提高。

科学数据确权需要在保护知识产权人享有技术创新带来的垄断利润,以及社会劳动生产率提升之间进行平衡,还需要考虑科学数据权的便于认定。因此,获得数据权的科学数据必须存在其他创作者不能轻易跨越的特征,并且具备获得超额剩余价值的可能性。

3.3 获取数据权的原则

科学数据涉及内容和编排方式两方面,因此数据权界定也需要从这两个方面进行考虑。其科学数据权界定应遵循以下原则。

(1)数据来源的多寡。科学数据来源越多,需要整合的力度越大,付出的劳动也越多,编排的方式越复杂,更应具有数据权。

(2)编排是否具有创造性。如果只是把多个来源的科学数据简单的按时间、地点排列,不涉及内部结构变动,那么其创造性和努力均不足以支撑其独创性界定。

(3)付出劳动量的大小。有的科学数据,尽管排列规则常见,但是数据收集过程本身具备难度,需要付出大量劳动,或者是数据来自作者观测,数据内容具有独创性。

(4)数据的共享和复用。数据获取后存在再利用、提高社会生产效率的可能性。

由于科学数据的复杂性,各类科学数据相差很大,因此深入研究还需要划分科学数据的领域,然后详细分析,制定细则。本文对此不再展开讨论。

4 科学数据权在多主体之间的分配

科学数据创造过程一般是,经费由科研资助投资方提供,科研设备(保障)由科研机构提供,数据创作者进行创作。创造涉及的主体包括科研资助投资方、科研机构、创作者三方。

4.1 多主体知识产权分配的实践

科学数据与职务发明专利类似,因此科学数据创作主体的确权可以参考职务发明专利的权利分配方式。

美国早在1921 年就通过司法判例明确,职务发明创造的专利权以合同约定优先。在没有合同约定的情况下,职务发明专利的所有权归属于职务发明人[24]。美国于1980 年实施《拜杜法案》,其核心理念是将在国家科研基金资助下取得的科技成果、专利发明,通过立法将归属权从国有变为高校或科研机构所有,从而促进国家科研能力的提升与科技创新发展。日本《特许法》在2015 年的最新修订中,赋予雇主与雇员在合同或劳动规章的权属选择权,即由双方可以通过自由约定来选择权利归属他们中的任何一方[25]。以色列的《专利法》也规定了对于“服务发明”采取约定优先的模式。对于未约定的,则规定这项服务发明属于雇主的财产,除非雇主在收到雇员发出的通知之日起6 个月内放弃了发明[14]。我国《专利法》第六条专门对职务发明进行约定,凡是“执行本单位任务”而产生的发明创造,其产权属于单位,单位有权处置这项发明专利。这样的产权激励方式往往会形成单位独占利益的局面,不利于调动科学数据创作者的积极性。

知识产权的分配方式是在一定的背景下产生的。基于职务发明权利配置中雇员与雇主之间的利益争夺,立法者在制定职务发明权属机制时往往会存在对于雇员或者雇主的利益偏向[25]。在工业化时代,由于物质资源的稀缺性,当立法者制定一项法律时,往往为刺激物质投资者的投资积极性而过分考虑物质投资者在法律上的优先权,也就是将一项职员智力成果财产权利完全赋予物质投资者。当前,智力已变成最为重要、最为稀缺的社会资源,这意味着立法者制定法律时应当更加关注智力作为一种资源对社会进步起到的重要作用。因此,有必要采取一种既能保有物质投资者的投资热情又有利于激发智力投资者的创新热情的立法取向。而日本、美国对知识产权的分配则偏向创造者,也就是充分考虑智力对创造的贡献。

上述分析可以发现,职务发明制度设计中兼顾雇员与雇主利益的需求愈发突出[25]。中国已经从职务发明创造的专利权归属于科研机构的制度开始逐渐过渡到科研机构和创作者共有。这意味着职务发明人逐步拥有职务发明的一定限度的“产权”,确保其创造和专利推广应用的积极性,从而促进社会整体知识价值的提升。职务发明专利权的分配逐步倾向创作者,为科学数据主体之间分配提供了实践探索。

4.2 多主体知识产权分配的理论依据

基于大数据产生的产品是知识产品的新的财产形态。如何运用马克思劳动价值论正确理解数字劳动、数字商品的内涵及数字化市场价格形成机制,以求达成大数据社会条件下的数字商品价值理论共识,而成为当前马克思主义政治经济学研究面临的理论争鸣热点和重大现实课题之一。

马克思将产品利润分为剩余价值带来的价值利润和垄断价格带来的价格利润。坚持劳动创造价值,价值决定价格[14]。知识产权正是获取垄断利润的工具。对于垄断利润,马克思提出绝对地租和级差地租,优质的土地和劣质土地获得的地租是不同的。无形资本同样有优质与劣质之分,两者获得的利益也不同[23]。

资本存在级差。投资利润率高于平均水平(以下简称“高额利润”)的行业为高等级资本,相反则为低等级资本。无形资本也存在级差。对于无形资本来说,低等级的无形资本不仅利润率低,而且依赖于高等级的资本。高等级的无形资本甚至能够产生垄断功能。具有同样功效的知识产权为产品带来的社会效益存在不同的可能性,因此知识产权也存在类似地租的现象。

地租类似于因科学数据使用权的垄断而取得的垄断利润。其中,绝对地租可类比于使用了科学数据一定比不使用科学数据产生更大的经济效应。这也是科学数据共享的基础,只有产生更大的经济效益、社会效益才有必要建立科学数据的共享机制。级差地租则可以类比使用科学数据的获得效益的不同。

在今天这样新的知识不断涌现的时代,新的高等级资本也会不断涌现,然后向低等级资本转化[22],由此实现社会的发展。

4.3 多主体之间的科学数据知识产权分配

在考虑利益分配时必须有依据。马克思认为数字商品中“活”劳动创造的价值所决定的成本与利润构成数字商品市场价格的价值基础。而智力因素直接影响到科学数据的质量。马克思在剩余价值中论述了人力的成本和价值。两者是不一致的。因此,社会或者单位同样的投入会产生不同的效果。

资本的所有者称为资本家,人力资本本质上属于个人。企业的投资拥有对人力资本的部分使用权,因此很多企业把人力资本也看成企业的,或者是企业和个人共同拥有的。这就模糊了资本主体所有权属性。

洛克的财产权劳动理论为解释职务发明人合理分享创新收益的正当性提供了一个极为重要的理论进路。根据洛克的理论,一个人拥有自己的身体,而劳动是由身体所产生的,将其劳动加入或者掺进那些在共有状态中所发现的资源,就产生了财产权[26]。

科学数据的获取和数据创作者的视角、水平有关,也就是数据创作者因水平不同而形成科学数据价值的差异。知识产权的权属其目的就是获取权益,因此可以将知识产权的权益分为两块:因数据垄断取得的绝对权益(即绝对地租)和级差权益(即级差地租)。当科学数据价值不随数据创作者水平不同而变化时,产生的价值为绝对权益;当科学数据价值随数据创作者水平不同而不同时,产生级差权益。获得绝对权益部分的权属应由科研资助投资方、科研机构获得;获得级差权益部分的权属应由数据创作者获得。随着科研水平的发展,级差权益将逐渐转化为绝对权益,也就是权属可以采取动态的方法,根据科研总体水平提升的速度,由数据创作者向科研资助投资方、科研机构逐步转移。

5 结语

科学数据已经发展到了大数据阶段,建立科学数据的共享机制是国家战略。科学数据共享机制的核心是利益分配,也就是明确科学数据的权属。

现有知识产权法对科学数据保护有不明晰之处,因此从劳动价值论的角度对无形资产及其知识产权进行分析,认为科学数据的知识产权归属需要考虑科学数据权界定的原则和科学数据多主体之间的权利分配两个层面。本文为科学数据权界定提出了4 项原则,并参照马克思地租理论将科学数据的权属划分为获得绝对权益部分和获得级差权益部分,获得绝对权益部分的权属应该由科研资助投资方、科研机构所属,获得级差权益部分应由数据创作者所属。随着科学水平的提升,科学数据的创作水平已经成为普遍共识,级差权益也可转化为绝对权益。

猜你喜欢
知识产权科学
Mesenchymal stromal cells as potential immunomodulatory players in severe acute respiratory distress syndrome induced by SARS-CoV-2 infection
点击科学
点击科学
点击科学
科学大爆炸
重庆五大举措打造知识产权强市
关于知识产权损害赔偿的几点思考
科学拔牙
知识产权为“互联网+”护航
知识产权