编制受控词表的著作权侵权风险及其应对策略

2022-02-08 19:41黄国彬张士男
图书馆论坛 2022年3期
关键词:词表独创性术语

黄国彬,郑 霞,张士男,程 冰

0 引言

受控词表指的是为消除自然语言的模糊性、满足信息组织和检索的需要而编制的人工控制语言系统,旨在明晰知识组织体系概念表述的专指度和语义关系的精确度,从而提高信息检索的质量和效率[1]。据词表注册网站Taxonomy Warehouse的统计,截至2020年12月底,全世界的分类表和叙词表已达820多种[2]。在此背景下,如何维护受控词表编制主体的合法权益,尽可能规避参与机构在编制受控词表过程中侵犯他人著作权的风险,值得研究。从现有研究成果来看,尽管国内对受控词表著作权问题的探讨较少,但与之类似的案例,如汇编作品、数据库作品和字词典等侵权案件受到广泛关注。在汇编作品的著作权方面,王迁[3]认为汇编作品的独创性主要体现在对作品、数据或其他信息的选择和编排上,如果汇编者并非基于个性化的主观判断,那么汇编的结果不能作为汇编作品受到著作权保护。在词典的著作权方面,张平[4]分析“王同亿系列著作权纠纷案件”:由王同亿主编、海南出版社出版的词典《新法编排汉语词典》虽然与中国社会科学院语言研究所编制的《现代汉语词典》的词条排列方式完全不同,但各个词条的解释和例句相似度达到90%以上,因此法院认为《新法编排汉语词典》侵害了《现代汉语词典》的著作权。对数据库的著作权问题,具有较大分歧,主要体现在对其独创性认定标准看法不一。许春明[5]认为,数据库的独创性既要体现“独立”(即独立完成)又要体现“创作”(即创造性);任玉翠[6]认为,对数据库的独创性应当从宽把握,只要其内容编排选择、界面设计等具有独创性,那么就可以认为数据库是一个新的汇编作品;孔德周[7]认为,由于难以对数据库的独创性做出明确判断,建议为其创立特殊权利加以保护。

由此可见,当前国内对汇编作品、数据库作品和字词典等的著作权问题尚未形成统一定论,而对于与之在内容编排和编制过程方面存在相似之处的受控词表,其著作权侵权风险和保护问题也需要做出进一步分析。科技文献信息的知识组织体系(Scientific&TechnologicalKnowledge Organization Systems,STKOS)[8-9]是我国首个具有自主知识产权的大型外文科技知识组织体系,是最具代表性的受控词表。本文以受控词表的著作权侵权问题为研究背景,以STKOS超级科技词表为研究对象,探讨受控词表编制过程中可能面临的著作权侵权风险及其发生的原因,并在此基础上提出应对侵权风险的有益措施。

1 编制受控词表引发侵权风险的原因

1.1 STKOS概述

为促进科技文献实现从信息服务向知识服务的转型升级,由国家科技图书文献中心牵头组织,中国科学技术信息研究所、中国医学科学院医学信息研究所、中国科学院文献情报中心、中国农业科学院农业信息研究所共同参与实施“面向外文科技文献信息的知识组织体系建设与应用示范”项目[10]。项目构建的STKOS词表是在继承、整合、映射等基础上,基于国际上975部来源词表(其中核心词表201部[11])中的1,438万个来源科技术语,以及千万级外文科技文献关键词和用户检索关键词,经过原型化处理、词形规范、语义聚类、术语优选、术语合并等而建成的外文超级科技词表(包括基础词库、概念和范畴体系3个层面),它涵盖理工农医四大领域、拥有609万个基础术语和61万个概念,是目前覆盖领域最广、规模领先的大型超级外文科技词表体系,填补了我国大型外文知识组织体系的空白[10]。

STKOS的核心是概念,将具有相同涵义的、来源不同的术语及其变体通过概念标识联系起来,并在超级科技词表中通过概念释义、概念范畴、概念内的关系(同一概念各种表达形式间的关系),以及概念中译名等多种方式加以完善和扩充。在统一的词表集成框架体系下,表达超级科技词表的概念,确定超级科技词表的规范概念集。规范概念集的建设实现了来源词表、术语基于概念的整合,在整合过程中重点解决了同义表达的问题。其编制过程主要包括以下几个环节。首先,STKOS建立素材遴选标准、词表元数据标准、概念遴选规范、概念名称规范和范畴类名汉译生成规则等一系列术语遴选加工、概念归并提炼、关系梳理的知识组织体系建设标准规范[10]。其次,规范概念的遴选与确定:通过词形规范、词义规范、颗粒度控制相结合的概念归并原则,对来源术语进行遴选、归并,形成基础概念,并对概念的同义表达、优选词进一步进行遴选和规范,确定规范概念集。最后,建立并完善概念释义、范畴等。STKOS中的概念释义来自来源词表、专业词典等,基于此建立的STKOS概念体系元数据仓储需要注明释义来源信息。通常,此类标识主要包括各层次术语字串的代码标识,用以规定术语定义及关系的关联与利用,以便计算机对其进行处理和使用。

1.2 编制受控词表引发侵权风险的原因

受控词表的编制需要以相对客观的知识体系作为构建依据,其独创性会受到一定限制。而且编制过程中涉及主体较多,加之国内外对受控词表的著作权归属尚未形成统一定论,因此编制受控词表容易引发著作权侵权风险。

(1)受控词表的独创性受到限制,使得侵权界限难以把握。受控词表整体的著作权主要体现在其内容的“选择”和(或)“编排”具有独创性。但是,各国法律对受控词表独创性的规定存在差异,有的要求内容的“选择”和“编排”都必须具有独创性,而有的法律只要求其一具有独创性即可。需要指出的是,受控词表的功能是标准化、一致化、统一化,起到准绳的作用,如果任由编制者在内容的“选择”和(或)“编排”方面发挥独创性,那么受控词表就失去了“被普遍遵循”的意义。这与我国图书馆图书分类法从多元到单一的发展路径就可窥一斑。另外,受控词表中的许多内容(如释义)往往具有权威性、唯一性,不能任由编制者发挥独创性,只能“原样拿来”,甚至“照抄”,这是否存在侵权问题,法学界尚有争论。当然,公知、公用的“通用内容”和具有独创性内容的区别与界定往往也是一个难点。

(2)编制受控词表涉及主体较多且缺乏有效授权。受控词表是信息组织的语义工具,在编制过程中需要利用的资源量较大而且细碎,涉及的权利类型广泛、权利人众多。然而,当前有关受控词表的著作权管理信息,或者信息完全缺失,或者授权法律制度、授权机制不健全,且存在“无主作品”“孤儿作品”等问题,大大增加了授权的周折和成本,也增加了侵权的风险。但是,如果不为编制主体提供必要的自主管理和自由编制受控词表的权利,会致使其被迫舍弃许多重要的、核心的汇编内容,那么势必影响受控词表的质量,也无法使受控词表的功能发挥最大效用。

(3)编制受控词表的著作权法律关系较为复杂,不利于授权的实施。编制一部学科范围广泛、内容构成丰富的受控词表,一个研究者的知识水平往往是有限的,且不能恰如其分地把握词间关系,往往需要采用集体组织编制的形式来确定词表体系结构和内容构成。在此过程中,必然产生各种法律关系,如职务创作关系、合作创作关系、委托创作关系,而且这些法律关系往往套叠、交叉,相互制约,影响词表编制者对权利主体的判断,进而对授权起到负面效应。

2 编制受控词表引发侵权风险的类型

2.1 内容构成特殊引发的侵权风险

如前所述,受控词表是一个由众多来源词表构成的规范化知识组织工具,在其创建和开发中,通常需要采用相关工具完成词表类目的自动映射、自动匹配、一致性检验等。由于受控词表的内容构成存在特殊性,致使其可能面临3类著作权侵权风险。

(1)来源词表大多数是受知识产权法律有效保护的作品。以STKOS超级科技词表为例,对其主要核心来源词表的知识产权情况等进行调研,发现部分著作权信息尚不明确。对受著作权法律保护且处于保护有限期内的作品,其合法使用要么依据法律规定的合理使用或法定许可,要么利用著作权拥有人让渡的专有权,否则,必须接受著作权拥有人提供的格式协议(如“下载-同意”协议),或者是双方经过商议后签订的著作权作品授权使用许可。反之,无论是否出于公益的目的,都有可能引发侵权。

(2)缺乏著作权信息的来源词表难以适用著作权集体管理条例。《著作权法(2020修订)》规定:“使用改编、翻译、注释、整理、汇编已有作品而产生的作品进行出版、演出和制作录音录像制品,应当取得该作品的著作权人和原作品的著作权人许可,并支付报酬。”问题的关键是,无法获取著作权人信息的来源词表,其著作权拥有人尚且无法知晓且无法及时联系,更不用说支付报酬了。那么,能否由STKOS承建单位先行提取一笔专项经费,留存在著作权集体管理组织,委托其在确认著作权拥有人后代为支付报酬?依据《著作权集体管理条例(2013修订)》第19条规定:“权利人可以与著作权集体管理组织以书面形式订立著作权集体管理合同,授权该组织对其依法享有的著作权或者与著作权有关的权利进行管理。权利人符合章程规定加入条件的,著作权集体管理组织应当与其订立著作权集体管理合同,不得拒绝。”然而,从该规定看到,著作权集体管理组织能够代为接收作品使用者支付的使用报酬,前提是“权利人可以与著作权集体管理组织以书面形式订立著作权集体管理合同”。对STKOS承建单位来说,目前引用的主要是无法获得著作权信息的来源词表,多数属于国外法人作品,而且这些法人作品,很少与我国的著作权集体管理组织以书面形式订立著作权集体管理合同。因此,STKOS承建单位委托我国的著作权集体管理组织向这些来源词表的国外法人代为支付使用报酬,在实现路径上无法可依。

(3)只要有一部词表被控侵权就有可能引发多部词表的侵权指控。受控词表的建设、开发与编制通常采用集体编目的形式,且由国家资助的国家级图书情报机构联合承建。无论是从建设定位与建设过程,还是从投入使用后的服务范围来看,辐射面较广,一旦发生著作权侵权纠纷,往往很容易产生极大的负面影响。再以STKOS超级科技词表为例,由于该词表所有来源词表的著作权所有人均为国外法人,一方面国外立法界、司法界和学术界会借此大做文章;另一方面,相关词表的著作权拥有人也会进一步关注自身的词表是否会被STKOS不合法使用。而一旦在与国外法人的侵权诉讼中败诉,则案件的起由、败诉的原因、判决的依据,均有可能被STKOS所使用的其他词表国外法人所借鉴,甚至是直接作为判例依据。因此,STKOS有必要及早采取有效的应对措施,杜绝任何一起侵权纠纷的出现,更不应该也不允许出现败诉的情形。

2.2 编制过程复杂引发的侵权风险

与其他传统的出版物不同,编制受控词表需要众多组织机构协同参与、共同商讨才能完成,且需借鉴和参考已有公共领域词表,并在此基础上进行互操作处理。也就是说,受控词表的编制过程具有一定的复杂性和特殊性,在此过程中易产生3类侵权风险。

(1)承建单位未签订授权使用协议引发侵权风险。通常在编制受控词表之前,承建机构并不与委托方签订授权使用协议,且这种情况较为普遍。从微观来说,根据引用的内容(术语、概念、释义)、引用的比例,并不是每一部来源词表的使用都需要获得授权许可。从宏观分析,在所引用的没有获得授权的来源词表中,出现对一部分词表的引用,难以有充分的证据来证明其完全处于某一部现行著作权法律规定的合理使用或法定许可的范围之内。解决这一问题的唯一出路就是签订使用授权协议。但STKOS在此方面的实际情况是,先发生词表的引用行为,而对多种词表的使用,因编制时间的限制,加上难以或无法联系到词表的版权拥有者,因而并没有事先签订使用的授权协议。从这一角度理解,只要某部来源词表发生侵权行为,则需要整个STKOS组织单位或承建单位承担侵权责任。

(2)受控词表对来源词表的使用涉及多项著作权专有权。在编制受控词表过程中可能涉及多项著作权专有权[12]。具体来说,第一,编制受控词表需要引用多个来源词表,包括其术语、概念、释义,这就涉及“复制权”;第二,受控词表的开发需要集合多个来源词表,涉及著作权法中的“汇编权”;第三,在此过程中需要将相关来源词表的术语、概念、释义进行汉化,涉及著作权法中的“翻译权”;第四,如果引用一部词表的术语、概念、释义,其篇幅超过原词表50%,且对这些术语、概念、释义作了相关的修改,则有可能涉及“修改权”和“保护作品完整权”;第五,对来源词表的术语、概念、释义进行整合、汇编后,受控词表将可能进行网络传播,则涉及这些词表的“信息网络传播权”。概括起来,编制受控词表过程中,若对他人享有著作权的词表使用不当,则有可能侵犯词表的复制权、汇编权、翻译权、修改权、保护作品完整权和信息网络传播权等6项知识产权专有权。

(3)难以有效利用“唯一表达方式”的原则应对汇编作品的著作权侵权起诉。“唯一表达方式”是指对于某种思想只有一种表达方式。在对来源词表进行引用的过程中,有部分词表只涉及对术语的引用,能否利用“唯一表达方式”来规避受控词表承建单位的著作权侵权风险,这需要作深入剖析。对一些来源词表,若受控词表的承建单位只是少量引用(引用比例和引用的绝对数均处于“少量”的状态)某一来源词表的术语,而不涉及其概念、范畴、释义等细节性内容,则可以利用“唯一表达方式”作为著作权侵权的抗辩理由。当然,若存在词表的使用不属于前述情形,则受控词表承建单位对来源词表的著作权侵权风险依然存在。

2.3 法律范围模糊引发的侵权风险

除上述因受控词表的内容构成和编制过程可能引发的侵权风险外,受控词表还面临法律范围模糊的侵权风险。

(1)来源词表的著作权拥有人身份难以或无法确定引发侵权风险。由于构成受控词表的来源词表具有公开性的特点,部分来源词表存在著作权拥有人身份不确定的情况,这必然会引发受控词表侵犯他人著作权的法律风险。对STKOS词表知识产权的调研显示,无法获取著作权信息的词表中,存在一部分无法获取所有权机构信息。无法获取著作权信息意味着其著作权保护期限不明、著作权拥有人无法联系、著作权让渡情况不明、著作权授权协议的签订方式(格式协议或经双方商量的许可协议)不明。考虑到公益性使用是法律规定的合理使用或法定许可的必要非充分条件,因此,著作权拥有人身份不明确,将使STKOS难以遵循格式协议,也无法签署使用许可协议,进而可能引发知识产权的侵权行为。

(2)受控词表可适用的著作权法律的不确定性引发侵权风险。现阶段国内外尚未出台有关词表的著作权法律规定,这对受控词表可适用的著作权类型、著作权纠纷处理考虑因素以及后续处理措施等造成了极大困扰。比如,STKOS的词表涉及国外法人作品,围绕其产生的法律关系属于涉外民事关系。在处理涉外著作权问题时,包括可适用的法定合理使用或法定许可,签署使用许可协议,通过诉讼、调解、仲裁等方式解决著作权纠纷等,均需要首先确定可以适用的著作权法律。著作权法律的适用,优先考虑著作权拥有人和使用方双方的事先约定,其次才是依据法律规定,在侵权纠纷处理时再选择可以适用的法律。事实上,STKOS所使用的词表,面临着部分来源词表难以甚至是无法获得著作权人信息的困境,如何约定可以适用的著作权法律,成为完全避免侵犯他人著作权的最大瓶颈。

(3)受控词表缺乏法律明确、直接规定的合理使用或法定许可以作为支撑。依据国内外有关国家和地区现行著作权法律的规定:无论是引用数量占原词表的比例超过50%,或者是引用数量占原词表的比例不高(如低于25%)但引用的绝对数量却构成受控词表的重要实质组成部分(如直接引用的术语量超过1,000个),均不符合英国、美国、澳大利亚现行著作权法律可以适用的合理许可范畴。毕竟,公益性使用始终是法定合理使用或法定许可的必要而非充分条件。由此可见,由于缺乏法律明确、直接规定的合理使用或法定许可的支撑,受控词表编制当前仍存在极大的侵权风险。

3 受控词表引发著作权侵权风险的应对策略

为应对可能引发的侵权风险,作为受控词表编制的承担者与直接责任主体,词表编制者应主动学习著作权法相关规定,精准把握受控词表的合理使用范围,将词表引用比例、引用方式控制在合理范围内,并呼吁相关立法机构设置专门针对受控词表的著作权保护权限,有效应对受控词表编制引发的著作权侵权风险。

3.1 精准把握受控词表的合理使用范围

从内容构成来看,STKOS主要包括科技术语、来源术语、来源概念、来源词表、术语相关关系(如用、用和、组代、参)、规范概念、范畴类、范畴表、术语属性(如术语类型、注释)等[13]。其中,概念与术语相关关系基本属于已“约定俗成”的社会公知或常识,可直接加以引用,且不构成侵犯著作权;而对于注释等术语属性,则是能够体现出词表编制者智力创造的模块,具有独创性。若对已出版受控词表中的注释内容直接进行引用,而没有标明出处,或者是大量引用却没有获得词表原有版权人的书面许可,则可能面临著作权侵权问题。对此,词表编制者应当结合版权人所在国家的政策法律、编制者所在国家的政策法律,以及双方签订的双边协议,进一步明确受控词表不同内容模块的合理使用规范。

3.2 设置专门针对受控词表的著作权保护权限

由于内容构成、编制过程、编制形式等较为特殊,受控词表与一般作品在著作权保护方面存在区别。为了有效平衡受控词表版权人和使用者的合法权益,词表编制者应当借助法律手段,基于自身学科特点,从判断标准和保护方式等方面出发,通过合理方式呼吁立法部门设置专门针对受控词表的著作权保护权限。判断标准方面,需要清晰界定受控词表各内容模块的引用情况,重点判断其是否具有“独创性”,并以此作为编制受控词表是否侵犯著作权的依据;要强调受控词表的内容不应被随意复制和使用的权利,进一步维护词表版权人的合法权利。

3.3 合理控制受控词表引用的比例

尽管术语概念和词间关系是经过打磨的人类基本共识,在编制受控词表时可以直接引用,但是也要注意合理控制引用比例。一方面要考虑直接引用内容在原有词表中的比例;另一方面也要考虑所引用内容和篇幅在最终形成的受控词表中的比例。需要指出的是,随着互联网技术在词表编制中的广泛应用,网络版受控词表在其后台词表架构中,对已有词表的引用控制较为宽松;但对于即将呈现给终端用户的词表系统,必须注重细节,要规范其知识组织和管理方式,合理控制引用比例。

3.4 获取词表版权人的授权许可

与一般作品不同,词表的编制往往需要花费大量的时间、财力和人力成本,其出版周期也相对较长。面对这一现状,词表编制者应当在出版受控词表之前,制定著作权侵权的处理方法和应对措施。一方面,在引用已有词表时,编制者应当尽可能告知并获得来源词表版权人的同意;另一方面,要出版相应标准,明确引用已有词表的方式、时间和期限。如果确实难以获得词表版权人的授权,也可通过公开的渠道(如公告)进行版权声明,以争取抗辩权。

3.5 探索受控词表的著作权集体管理模式

积极向著作权集体管理组织寻求帮助,对受控词表的著作权实施更规范化的保护。对确实需要为词表版权人支付报酬的,以本国现行的著作权法律为基础,参照著作权作品有偿使用的标准,按照词表的使用目的、范围和方式,提前将版权许可费交予集体管理组织,由其代为保管。一旦发生著作权侵权,可以由集体管理组织代为支付赔偿费用。对于经过多方努力仍无法联系词表版权人的,有必要请集体管理组织协助,争取与词表版权所有人取得联系,以本国现行的著作权管理组织标准,依据词表的使用范围和方式,支付相应的使用报酬。

4 结语

受控词表的实质是对文献情报内容和核心概念及其相互关系进行表达的概念标识系统[14]。作为知识的组织工具,其主要功能体现在以下几个方面:一是标引文献情报的外在特征和内容信息;二是揭示信息资源的相关性并对内容相同或相关的情报进行集中处理;三是对大量情报加以系统化或组织化;四是比较标引用语和检索用语的相符性。基于上述分析可知,编制受控词表可能面临的侵权风险包括:内容构成特殊引发的侵权风险、编制过程复杂引发的侵权风险以及法律范围模糊引发的侵权风险。若对此类风险的意识和重视不足,参与人员和编制机构或将承担一定的行政责任和民事责任。囿于篇幅有限,笔者对受控词表编制所涉及的复杂法律关系并未作详细阐述。随着计算机技术在受控词表词汇选择与组织中的深入应用,受控词表的编制过程所面临的著作权风险类型和法律后果也愈发复杂,当务之急是尽可能规避受控词表侵权风险,做好受控词表的著作权保护工作。

猜你喜欢
词表独创性术语
论非独创性数据库的邻接权保护模式
基于VOLT的藏汉双向机器翻译
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奥会项目名称汉英对照词表
近十年国内外专业学术词表建立文献综述*
试论我国作品独创性的司法认定标准
中国小说与史传文学之间的关系
文学作品的抄袭认定法律问题
有感于几个术语的定名与应用
从术语学基本模型的演变看术语学的发展趋势
常用联绵词表