双源数据导航下科技创新知识流向研究
——以中国人工智能领域为例

2022-04-25 10:08宋文娟毛荐其魏延辉
山东工商学院学报 2022年2期
关键词:流向科学知识明星

刘 娜,宋文娟,毛荐其,魏延辉

(1.山东工商学院 工商管理学院,山东 烟台 264005;2.煤炭产业发展与创新研究基地,山东 烟台 264005)

一、引言

新一轮科技革命和产业变革蓬勃兴起,科学探索加速演进,学科交叉融合更加紧密,一些基本科学问题孕育重大突破。世界主要国家普遍加强对基础研究的重视,全球科技竞争也不断向基础研究转移[1]。国家重视基础研究的目的是为了研究发现被商业化,加快技术创新,但前提是这些研究发现能够被企业识别并采用,否则那些很少或者根本没有受到关注的科学发现不太可能被转化为新技术[2]。科学知识商业化应用是指科学发现从学术科学家到将其商业开发的人们的转移[3]。科学知识商业化可以使学术科学家产生的科学知识不再被“束之高阁”,能够发挥科学知识的经济价值;同时也能给企业提供创新思想,获得核心竞争力。科学研究的商业化应用存在着以下几种途径:科学家利用自己的科学研究进行学术创业;企业雇佣科学家作为员工;企业参考科学家出版物或专利等[4]。

如何实现和加快科学知识商业化已成为企业甚至是各个国家的重要目标。Michaёl Bikard和Matt Marx[5]利用报告相同发现的科学论文证明了学术研究机构和工业研发机构的不同地理分布似乎造成了学术科学转移的“摩擦”,阻碍了科学知识商业化;Matt Marx和David H.Hsu[6]针对初创企业作为科学知识商业化的中介,揭示了以前的合作者包括明星系列企业家或者跨越更多学科的科学团队更有可能通过初创公司将自己的发现商业化;Aaron Fuegi等人[7]探索了发明家和科学家如何寻找可商业化的基础科学,以及大学发明被公司利用的过程,研究结果发现发明主要发生在两个截然不同但有些重叠的领域:“开放科学”的实践主要发生在学术界;而商业领域则可以获得暂时的垄断,只能利用专利对科学论文的引用进行探索,深入研究仍存在挑战。

由于科学知识的复杂性或隐蔽性,知识的转移成本足够高,而且知识体现在与特定地点相关的特定个人身上。特别是在新兴的研究和创新领域,知识库的关键部分只能在该领域的关键科学家的“头脑”中找到[8]。只有当这些个人与更大的群体分享他们的知识时,关键的科学知识才有可能被识别采用。除此之外,企业有限的精力和时间使得企业的注意力并不能均匀分布,他们会有效地将注意力分配到最有价值的科学发现上。在学术界存在着这样一种情况:一小部分学术科学家却占据着相关领域的绝大部分科学发现,并对创新绩效影响巨大。Zucker和Darby等人[9]在研究中,统计生物科技领域到1990年有超过40个基因序列发现或更多报道基因序列发现的文章的科学家,发现这些科学家只占到1990年在GenBank中列出的所有科学家的0.8%,但占已发表文章的17.3%,明星科学家第一次被使用。随后的研究对明星科学家的认定取决于对杰出研究业绩的基本定义,即是指那些科研成果卓著、在学术界享有较高知名度并且社会资本较为丰富的顶级科学家,他们对行业技术进步发挥着重要影响[10]。Hohberger[11]调查了明星科学家对后续发明价值的影响程度,他发现根据明星科学家的想法能够创造一项更成功的发明,揭示了明星科学家在知识积累中的重要性;Kehoe和Tzabbar科学家[12]探讨了明星企业科学家对企业组织创新绩效的影响,强调了明星企业科学家对公司业绩影响的二重性,虽然明星企业科学家对公司的生产率有积极的影响,但他们的存在会限制组织中其他创新领导者的出现。明星科学家在创新网络不同位置所承担的角色也有不同,对知识流动的作用也不同,Schiffauerova与Beaudry[13]研究了明星科学家明星在网络结构中的位置,结果表明拥有较多专利的发明人在网络中占据着更核心的地位,他们拥有更多的合作者,更容易获得信息,也更能控制网络中的知识流动,对知识转移起着重要的作用。

现有研究多对科学知识商业化应用的影响因素进行探讨,然而,学术界基础研究及应用研究成果的商业化应用如何,企业界应用性技术研发活动对学术界科技发现有多大程度的继承和吸收?即科技创新的知识流向问题在国内还未充分探索。因此,本文以新兴人工智能领域为例,尝试对以下问题进行研究,以求在国家重视基础研究的战略中,为科学成果转化及技术研发活动提供建设性意见:(1)以明星科学家为代表,探索学术界科技知识流向;(2)以从事人工智能研发的企业为对象,探索企业技术知识来源;(3)学术界科技知识多大程度上流向了企业,企业的技术知识多大程度来自于学术界?

二、人工智能科技创新以及知识流向模型

新兴人工智能是研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门新的技术科学,是涉及计算机科学、信息科学、系统科学、控制论、语言学、认知科学等多学科的综合性技术学科,最早由McCarthy于1956年提出[14]。作为21世纪三大尖端技术之一,人工智能已被广泛应用于教育、医疗、国防、生产工业、生活娱乐等领域,对人工智能领域的科学商业化的探索研究是在新一轮技术革命中占据优势地位的必要条件,也为推动科技进步和社会发展提供助力。鉴于此,本文将新兴人工智能领域作为样本数据,考察中国在人工智能领域科技创新的知识流向。

科技创新知识流动是指知识在相关创新主体之间转移、交换和共享的作用过程,主要分为知识溢出、知识共享、知识转移和知识扩散四种形式[15]。知识流动的互动机制主要分为四种,第一种为创新企业之间的相互合作和交流,通过研发、营销等业务行为进行有形资源和无形资源的共享,主要包括战略联盟、外包和研发合作,除此之外通过技术转让、新设备的应用也会使得知识在产业内部得以流动[16];第二种为高校、科研院所以及公共部门之间的协作和交流,通过联合研究、联合申请专利以及联合出版等其他非正式的联系来影响知识的流向,这就会促使学术界内部知识的流动;第三种为创新企业与科研院所、公共部门之间进行协作或知识交流,产学研的合作方式会加快基础研究向应用技术的转移,从而学术界的基础研究会向创新企业[17-18];第四种是人员的流动,主要是科学家在公共或私有组织内部的流动,从而会促进知识在系统内的流动和扩散[18-19]。

由于技术突破变现的如此频繁,只有优秀的科学参与者才能为技术轨迹提供指导[20],科学家从事基础科学研究,科学突破是由特定的个人创造的,体现在特定的个人身上,并在特定的组织和地点进行商业化应用。最优秀的科学家(明星科学家)影响科学传播的速度及其商业化应用的时间、地点和成败[9]。从理论上讲,从事人工智能科学研究的中国科学家产生的基础研究成果存在四种流向:中国AI学术界、国外AI学术界、中国AI企业及国外AI企业。其中,从中国AI学术界流向AI企业,代表了基础成果的商业化应用。Arora等人[21]研究发现公司内部对于基础研究的资助正在减少,而是依靠学术界的科学发现,尤其是在生物制药领域。科学知识商业化是企业主体为进行技术创新并提高企业核心竞争力开展的对基础研究产生的科学知识的识别、吸收整合的过程,其目的在于获取企业能够进行应用研究的科学发现,进而研发新的技术和产品。从事人工智能技术研发的中国企业产生应用性研究成果,满足社会生产的实际需求。理论上,我们将中国AI企业的技术知识来源划分为:国外AI学术界、中国AI学术界、中国AI企业、国外AI企业(见图1)。

图1 人工智能科技创新知识流向概念模型

三、数据来源

我们用中国科学家在人工智能领域的产出论文表征基础科学知识,将其施引文献作为科学知识的流向。为了获取数据的方便性,我们选择中国在人工智能领域的明星科学家作为研究对象。明星科学家的筛选方法有多种。一部分文献按照科学家的基础研究成果界定明星科学家,最早由Hess和Rothaermel[22]把文章发表和引用数量超过同行平均水平3个标准差的科学家定义为明星科学家;Tzabbar和Kehoe[12, 23]分别根据科学家的专利得分是否超过同领域的一个或两个标准差确定明星科学家。还有一部分文献按照社会知名度和社会资本界定明星科学家,例如Higgins、Stephan等人[24]将诺贝尔获奖者作为明星科学家。本研究采取基础研究成果选取明星科学家。

Liu和Shapira[25]给出了追踪新兴人工智能的文献计量定义,被证明能够查全查准地捕获人工智能论文和专利数据。我们使用Liu和Shapira[25]的文献检索式,在web of science中下载了1990—2020年中国人工智能的论文数据,共计129 478篇。然后,对作者信息进行彻底清洗和识别,分别按照发表数量和被引频次进行排序取其交集,获得top15的科学家(如表1)。我们下载了15位明星科学家的施引文献,并通过DOI分类号进行去重,共获得75 473篇施引文献。我们使用Liu和Shapira[25]的专利检索式,从Patentsight数据库下载中国发明人获得的专利,清洗后,获得136 520专利家族。我们对中国发明人的专利数据进行分析,识别15位明星科学家所拥有的专利及他们的技术知识流向、中国企业所拥有的专利以及它们的技术知识来源。

表1 明星科学家及其研究领域

续表1 明星科学家及其研究领域

四、数据分析

(一)明星科学家的科学知识及其流向

图2向我们展示了明星科学家的论文数量以及其施引文献数量的时间演化分布,说明了明星科学家科学知识产出及其随时间的扩散。可见,明星科学家科学知识的发生了巨大流动,从2005年开始持续增长;2010年之后,呈现出显著增长。

通过对明星科学家的施引文献进行机构识别,探析明星科学家的科学知识流向目的地。我们将施引机构分为高校、研究院所和企业。明星科学家的施引文献约有80%属于高校,16%属于研究院所,而企业仅拥有4%的施引文献。这说明明星科学家的绝大部分科学知识还是被高校和研究院所用于基础研究,流向企业的科学知识很少,由于基础研究所产生的科学知识本身具有隐晦性、抽象性和难以编码的特点以及受到企业自身知识吸收能力的限制,使得此类流向较为稀少,但基础研究产生的科学知识流向企业可以帮助其在长期内推动技术升级和突破。

图2 明星科学家论文数量及施引文献数量年度演变

我们进一步将明星科学家科学知识的流向进行了更细致的区分,表2展示了明星科学家施引文献的国内外对比。根据表2结果得出,明星科学家科学知识流向国内高校(57.26%)多于流向国外高校(42.74%),流向国内研究院所(60.45%)多于国外研究院所(39.55%),流向国内企业(47.7%)少于流向国外企业(52.28%)。因此,虽然由于地理、制度等邻近性以及知识根植性的原因,中国的明星科学家科学知识的流向以国内为主,但已有相当部分的科学知识流向了国外机构,这说明中国明星科学家科学知识影响范围是广泛的。

表2 明星科学家施引机构国内外对比

为了确认明星科学家的科学知识流向的最主要机构,我们对明星科学家施引机构进行排序,获得了明星科学家科学知识最频繁引用前10个机构,如表3。可知,前10个最频繁引用机构均为国内高校和研究院所。中国科学院是所有机构中最频繁的引用者,其引用明星科学家科学知识的频次为4 099,占比2.61%。西安电子科技大学、武汉大学、哈尔滨工业大学对明星科学家的引用频次占比均在1%以上。其中,中国科学院、西安电子科技大学、武汉大学、西北工业大学均为明星科学家所在的机构,四个机构对明星科学家科学知识的引用频次占比为5.26%,由此可见明星科学家科学知识转移时,所在机构作为知识接收方存在一定的优势,不论是在地理上还是在知识的理解程度上,会优于其他组织机构。

表3 明星科学家最频繁的引用机构

(二)明星科学家的技术知识及其流向

通过在专利数据集中根据current owners、inventors、applicant name的查找与匹配,我们从中国人工智能专利数据集共收集到15位明星科学家专利数据共计756个专利家族,专利总施引为2 436个专利。类似于明星科学家科学知识分析,我们以同样的维度分析明星科学家所拥有的技术知识及流向。图3提供了明星科学家施引专利的年度分布。从整体上看,专利施引数量并不像论文施引数量平稳增加,而呈现明显的波动。因此,明星科学家主要从事科学研究,技术发明及其影响不太显著,科学知识的产生是面向公众,为公共服务而创造,但是技术发明往往具有较强的私有性会在一定程度上阻碍知识的流动。

我们同样对明星科学家专利的施引机构进行了分析。明星科学家专利施引机构分布中,高校仍然占据第一位,占比62%,科研院所占比6%。与论文施引机构分布不同的是,企业成为明星科学家专利施引机构的第二位,占比32%。因此,明星科学家的技术知识流向虽然以高校为主,但在一定比例上流向了企业。基础研究和应用研究最大的不同在于其“应用性”,即接近商业化和市场化的程度,企业为了在短期内提高生产效率,会更加倾向获取明星科学家的技术知识。

图3 明星科学家专利被引年度演化

表4中是明星科学家专利施引机构国内外对比。可见,相对于明星科学家的科学知识流向,明星科学家的技术知识流向范围受到国家边界的限制程度很大。中国的明星科学家的技术知识绝大多数流向了国内的大学(99.7%)、研究院所(96.6%)和企业(88.2%),只有极少数的明星科学家技术知识流向了国外的大学(0.03%)、研究院所(0.35%)和企业(11.8%)。

表4 明星科学家专利施引国内外对比

表5提供了对明星科学家技术知识引用最频繁的10个机构,其中排在第一位的是西安电子科技大学,占比11.1%,中国科学院紧随其后,占比3.11%,值得关注的是国家电网作为唯一一家企业进入最频繁引用前10机构的行列。明星科学家技术知识与科学知识的最频繁引用者存在着重叠机构,如中国科学院、西安电子科技大学、武汉大学、清华大学、西北工业大学、哈尔滨工业大学,在最频繁引用机构中,其中包括西安电子科技大学、中国科学院、武汉大学、西北工业大学,有接近一半的机构是明星科学家所在机构,说明明星科学家知识流动的主力方向是自己所在的机构。

(三)中国企业的技术知识及来源

图4显示了中国发明人的人工智能专利申请的年度演化分布,可以看出人工智能专利的申请数量在2010年之前增长缓慢,2015年之后呈现飞速增长。从2015开始,人工智能专利申请的年度占比增加迅速,由2016年的10%上升至2017年的16%左右,2017年至2018年增长更为显著,2018年人工智能专利申请已经超越了全部年份的25%。2019年专利申请量的略微下降是由于专利从提交申请到发布的时间滞后性。

表5 明星科学家技术知识最频繁的引用机构

表6 企业专利知识来源机构分布

为了进一步了解中国人工智能企业技术知识的来源,我们对中国企业专利的后向引用,共计138 481频次进行了机构识别。如表6展示,在中国人工智能企业知识来源中有68.4%归属于企业,19.8%的专利技术来源是高校,研究院所的贡献在企业技术知识来源中占比0.36%,另外还有0.72%的专利是属于个人。

表7向我们展示了专利拥有量以及技术知识来源机构的Top15。对比可知,百度、中国科学院、腾讯、阿里巴巴、国家电网、清华大学、浙江大学不仅是人工智能专利拥有量表现突出的组织机构,也是中国企业人工智能专利技术知识的主要来源机构。清华大学、北京大学、浙江大学三所高校在为中国企业提供人工智能技术知识中表现出显著作用;除此之外,我们观察到不仅中国的组织机构是中国企业的人工智能专利技术知识的来源,国外企业如微软、IBM、三星、谷歌也是中国企业人工智能专利技术智能的主要来源,这体现了知识模型中全球产业知识流向中国企业,主要是通过企业间的研发合作、战略联盟等形式得以实现。

为了更加直观地了解技术知识的流动情况,我们分别选择中国人工智能专利拥有top150的企业和技术知识来源top150的机构,借助Gephi构建了有向加权网,并进行了可视化,如图5所示。图中较为突出的高校及研究院所有中国科学院、清华大学和浙江大学,突出的企业节点有百度、阿里巴巴、腾讯和华为等企业,其中,百度居于网络中心位置,不仅与企业间存在较多的连接关系,还与中国高校与研究院所间联系频繁。

图4 中国发明人人工智能专利(申请)年度演化分布

表7 人工智能专利机构Top15及知识来源机构Top15

根据节点及边的颜色可以得出技术知识的流动方向,根据边的粗细程度可以得到技术知识流量的多少。首先,在图中我们观察到技术知识的流动多是从企业流向企业,且流量较大,所以中国企业人工智能技术知识的主要来源仍然是企业;其次,仅有少数企业与高校及研究院所间存在技术知识的流动,且除中科院外,流量较小;可以发现只有百度、腾讯、华为、阿里巴巴、平安保险等少数企业将高校作为技术知识的来源,其中百度将多所高校作为其技术知识的来源。相比于高校,将研究院所作为技术知识的来源的企业相对多,且个别流向较大。在技术知识流动中,企业更加注重的是从同领域的企业中获取相关的技术知识,高校和研究院所并不是企业的首选,但是在人工智能领域较为突出的企业中,如百度、腾讯等均存在从高校及研究院所中获取技术知识的行为,这也体现了基础研究在人工智能技术创新中的重要作用。

五、研究结论

本文从学术界及企业界之间知识流动的角度出发,通过回答学术界科技知识去了哪里,企业技术知识来源于哪里,学术界科技知识有多少流向了企业以及企业技术知识有多少来源于学术界三个问题,试图探明中国人工智能科技创新的知识流向。通过引文数据、引文网络分析总结得到一下结论:

第一,明星科学家科学知识有80%是流向了高等院校,其中57.26%流向国内高校,42.74%流向国外高校,16%的科学知识流向了研究院所,仅有4%流向了企业,而且流向国内企业的科学知识少于流向国外企业,明星科学家论文的最频繁引用者均为国内高校和研究院所。根据科学知识与的流动和扩散分析,明星科学家知识的商业化应用程度较低,企业对于基础性知识的重视程度远远不够,产业界与学术界之间存在较强的壁垒。本文认为可以加强基础环境和制度文化环境建设,组建产学研知识联盟、加强企业知识管理、人才流动等方式促进创新体系知识流动。

图5 人工智能专利引用网

第二,在明星科学家技术知识的流动分布中,62%的施引机构仍是高校,企业以32%的比重排在第二位,其中接近90%的施引是由国内企业实施,相对于基础研究我国企业更加注重应用型研究;我国人工智能技术的创新呈现产学研导向的模式,主要的创新机构是高校、研究院所及企业并存,但是在机构数量上,以企业领先;在专利技术知识的流动中,多是由企业流向企业,流量相对较大,而由大学和研究院所流向企业的相对较少且流量较少,中国人工智能企业的技术知识来源主力均为企业。企业之间的研发合作、战略联盟等形式会有效地促进了产业间知识流动,可以通过进一步发展产业集群来加强企业间的技术知识流动。

由于企业内部对于基础科学研究的投入越来越少,企业会通过高校及研究院所等渠道获得补偿,并且世界各国越来越重视基础研究。人工智能技术能够得以迅速的发展也离不开科学家扎实的基础研究,但是要想大幅度的跨越科学与技术之间的“鸿沟”,实现人工智能技术从“不能用、不好用”到“可以用”的技术突破更需要的是科学知识更多地流向企业。科学、技术与商业多重联动的生态体系会对知识流动网络的形成产生重要作用,通过加强产学研的深度合作、企业间的业内竞争和价值链互补促进人工智能科技创新的知识流动。本文的贡献在于:我们构建了科技创新知识流向的概念模型,从理论上理清了创新过程中科技知识的来龙去脉,把明星科学家整体作为知识流动的重要一方,既可以避免传统知识主体的笼统,又可以观察到相关领域知识流动的重要信息,使得知识流动的主体具有代表性和具体性;对知识流动的方向进行了详细的解剖,对知识流动方向的分析不再是国别之间的差别,更加具体地分析了知识流动的机构差异。

本文也存在不足:本文仅依靠单一基础研究成果指标进行了明星科学家的筛选,筛选标准的不同可能对知识流动的分析存在影响,为了更加细分知识流动情况,未来可以考虑更换其他筛选标准,进行结果对比;分析了明星科学家与企业之间知识流动的情况,难免会让人更加好奇影响两者之间知识流动的关键因素有哪些,未来研究可以进一步探究。

猜你喜欢
流向科学知识明星
蜗牛看牙医
基于科学知识图谱的滑雪运动研究可视化分析
2000-2017国外关系从句研究动态的科学知识图谱分析
明星们爱用什么健身APP
社会化知识及其客观性探析——兼议朗基诺的科学知识观
扒一扒明星们的
十大涨跌幅、换手、振幅、资金流向
十大涨幅、换手、振副、资金流向
流向逆转的启示
谁是大明星