基于多代理模型的产学研主体协同创新行为演化博弈仿真分析

2019-07-25 04:01施慧斌刘修奇
价值工程 2019年18期
关键词:协同创新

施慧斌 刘修奇

摘要:为了解决产学研各方主体在协同创新合作过程中各方的收益的合理分配问题,从而达到深层次的协同创新效应,这是产学研合作各方追求的目标,高水平的协同创新行为可以衡量协同创新的深度,将演化博弈仿真加入到产学研协同创新合作过程中,引入多代理机制重点分析合作演化的初试变量设置对博弈结果的影响,并考察结果和原因。在有限理性的基础上,结合多代理思想理论和演化博弈理论,依托Netlogo平台构建模拟环境、政府政策以及产学研主体各方进行仿真,分析并验证不同参数设置下仿真实验的结果及其原因。

Abstract: To solve the problem of rational distribution of the benefits of all parties in the process of collaborative innovation and cooperation and realize deeper cooperation of all parties is the goal pursued by all parties in the industry, university and research cooperation, and high-level collaborative innovation behavior can measure the depth of collaborative innovation. The evolutionary game simulation is added to the collaborative innovation cooperation process of industry, university and research institute. The multi-agent mechanism is introduced to analyze the influence of the initial test variable setting of cooperative evolution on the game results, and the results and reasons are investigated. On the basis of bounded rationality, combined with multi-agent thought theory and evolutionary game theory, simulation of environment, government policy and the main parties of industry, university and research cooperation is conducted relying on Netlogo platform, to analyze and verify the results of simulation experiments under different parameter settings and their causes.

關键词:多代理;协同创新;建模仿真;NetLogo

Key words: multi-agent;collaborative innovation;modeling and simulation;NetLogo

中图分类号:G301                                          文献标识码:A                                  文章编号:1006-4311(2019)18-0017-05

0  引言

研究问题:

产学研主体的协同创新合作在当今的科研工作中非常重要,是产业企业、高校和科研院所以技术创新为目的,协同各自拥有的创新资源,对科学技术及产品、服务的合作开发过程[1]。由于产学研参与各方的合作动机、对投入资源的体量以及期望的收益与实际收益的差额等问题,这会导致产学研各个主体之间产生存在利益冲突,继而产生沟通上的隔阂,最终会增加合作主体协同创新的难度,使得产学研各方之间深层次的合作成为难题,影响科学研究转化成商业成果的进程。因此在产学研各方主体的协同创新过程中,如何确保参与各方的行为协调一致,如何达到对对方的深度认知,如何达成深层次高水平的协作,这事关产学研协同创新合作的成败。这需要从大局上把握和分析协同创新的行为模式和合作模式,对产学研协同创新的运行规律及实现结果进行深度、以及合理地预测评估各方行为模式背后的深层原因,从而能对整体环境和政府政策进行合理把握,最后达到去准确预知产学研各方未来合作问题的效果。

理论基础:

关于协同创新参与的各方主体如何进行合作一直是个热点问题,部分国内外学者对这个问题展开过多方面的研究,已经形成了一定的研究成果。例如国外学者Baldwin等[2]在讨论了快速增长的协同创新模式之后,认为协同创新模式已经成为一种重要的思考模式,并且这会影响协同创新合作过程中的方方面面;同样,Inzelt等[3]讨论了产学研协同创新网络适合的应用场景,提出了影响协同网络创新相关的环境要素;Cohen等[4]将协同创新的过程分成了正式合作和非正式合作两种情形,并且认为非正式合作在协同创新过程起到着更大的作用。

国内学者同样在此方面做了相关的协同创新研究,例如陈劲等[5]在研究协同创新时根据整合维度和互动维度构建协同创新框架,针对产学研协同创新平台和组织给出了几点建议;何郁冰等[6]等研究了产学研合作过程中提出了“战略——知识—组织”三者相结合的协同创新模式,用来探索高校和企业之间的深度合作与发展问题;刘晓玲等[7]在基于协同创新背景下,提出了协同创新工作室对协同创新人才的培养,探索了机电类协同创新类人才的培养模式;肖泽磊等[8]对湖北省制造行业的创新绩效做了测度,研究结论得出湖北省制造行业内存在“技术异质性”,行业的协同创新绩效随着不同行业“技术特征”的变化而变化;覃艳华等[9]基于粤港澳大湾区11个城市协同创新数据进行了计算和分析,指出了大湾区科技协同创新存在的一些问题,并且就这些问题提出了相关建议和对策;孙卫东等[10]在研究协同创新过程中以中小企业的产业集群为背景,阐述了协同创新中中小企业转型升级的路径和探讨了中小企业商业模式创新的思路。

基于目前的大量的研究成果得出,很多学者和专家都善于从现状去分析问题或者利用演化博弈模型去进行探索问题,但是固定的模型无法对整个产学研协作创新过程进行准确的分析,也无法解决产学研合作过程的各种利益和冲突问题。另外有学者使用Netlogo对演化博弈过程进行了仿真分析,但是由于缺乏对产学研具体仿真的环境建设,仅仅单纯的使用产学研双方去演化整个博弈过程,无法精确分析产学研各方如何选择策略的原因,无法从中解决突出矛盾。本文使用基于多代理的Netlogo建模方法,建立具体的仿真环境以及产学研各方,从中发现围绕产学研利益冲突的始终。

1  演化博弈模型建立

在产学研合作过程中,产学研各方的投入和产出是整个演化博弈的核心,目的在于达到双赢的效果,这需要双方一定程度的投入,并且需要最終成果共享,达到整体效益最大。在产学研协同创新过程中,主要以企业为代表的产方和以高校为代表的学研方为核心,其中政府提供一些政策支持和营造相关知识产权方面的法律环境来规范相关产学研活动的进行[11],另外还包括一些社会性组织例如中介服务、私人基金或者媒体力量对产学研协同创新活动进行引导、支持、成果转化和提供舆论风向标的作用。

1.1 演化博弈模型的建立

本文采用演化博弈的方法对产学研协同创新过程进行产学研协同创新过程中的动态演化分析。演化博弈论是把博弈论结合动态演化过程后进行整体分析的一种新型博弈理论[12-13]。由于产学研过程中的成员都是具有有限理性,因此产学研各方将在博弈过程中保持有限程度的各自受益最大化。

双方在合作过程中可以选择高水平的协同创新合作策略,也可以选择低水平的协同创新合作策略。这里的低水平的协同合作指的是浅层次合作,或者说一次性合作,沟通互动和信息共享程度很低[14],因此低程度合作的一方往往在合作过程中投入非常少或者不愿意共享自己已有的资源。与此相反,高水平的协同合作意味着某一方在协同创新过程中相当深入的投入到合作当中或者把自己拥有的资源进行深度共享。如果双方都进行这种深层次的协同创新合作,这会随着时间的推移往往会形成产学研合作同盟,这需要双方频繁有效的沟通以及高度的信息共享,这种协同效应会带来相当高的回报和投入产出绩效比。

在本文的研究中假设参与协同创新的主体主要分为两方,分别用产方和学研方来表示。在产学研协同创新过程中,协同创新主体无法确切掌握对方的实际合作的投入成本等相关资源,导致协同创新主体在协同创新活动中采取机会主义行为,控制自己的各项成本以达到更大收益,在博弈过程中表现为低水平的协同合作。假如某一方在协同创新过程中采取机会主义行为,选择付出较低水平的协同合作行为,而如果另一方不能判断出这种低水平的协同合作行为,那么另一方可能就会继续采用付出较高知识水平的协同合作行为,这就容易造成另一方受益高,而另一方受益极低甚至亏损。而如果双方都选择低水平的协同创新合作,由于双方都没有进行大规模的相关资源的投入,在双方受益都不高的情况下或许都能弥补所投入的成本,导致最终双方都能有所受益但是收益不高。最好的情况就是双方都能以高水平的协同创新合作投入相应的成本和相关资源,最终都能获得较高的收益,这表现为双赢。

本文假设学研方选取低水平协同合作行为所付出的成本为c1d,选择高水平协同合作行为所付出的成本为c1u;学研方选取低水平协同合作行为所付出的成本为c2d,选择高知识水平协同合作行为所付出的成本为c2u;假设学研方采取低水平协同合作而产方采取也采取低水平合作的共同收益为rd,假设学研方采取低水平协同合作而产方采取高水平合作的共同收益为rb,假设学研方采取高水平协同合作而产方采取低水平合作的共同收益为rl,假设学研方采取高水平协同合作而产方也采取高水平合作的共同收益为ru;基于双方事先商定的协议内容,如果学研方获得产学研协同创新成果的比例为?琢(?琢?燮1),那么产方获得产学研协同创新成果的比例?茁(?茁?燮1),按照设定?琢+?茁=1。基于以上多条假设,本文的演化博弈模型表现为:博弈参与方集合?子={学研方,产方};学研方的策略行为集合s1={低水平协同合作,高水平协同合作};产方的策略行为集合s2={低水平协同合作,高水平协同合作}。本文分别对协同创新过程中产方主体和学研方主体采取在做出不同的策略选择情况时发生的收益变化进行了讨论,根据上述论证,产学研协同创新博弈的收益矩阵如表1所示。

假设学研方的混合策略为(p,1-p),p∈[0,1],学研方以p的概率选择低水平协同创新合作行为策略,以1-p的概率选择高水平协同创新合作行为策略;同理假设产方的混合策略为(q,1-q),q∈[0,1],即产方以q的概率选择低水平协同创新合作行为策略,以1-q的概率选择高水平协同创新合作行为策略。

学研方选用混合策略(p,1-p)的收益函数可以表示为

产方选用混合策略(q,1-q)的收益函数可以表示为

于是,求解混合策略纳什均衡等价于求解以下最优化问题:

学研方和产方收益函数对应的最优化一阶微分条件为

分别求解可得

当?琢ru-c1u-?琢rb-c1d<0,?琢(ru+rd-rl-rb)>0时,意味着博弈双方采取同种策略的收益高于双方采取不同策略的总收益,而且双方都采取高水平合作时一方采取高水平协作的收益低于双方采取不同策略时一方采取低水平合作的益;

当?琢ru-c1u-?琢rb-c1d<0,?琢(ru+rd-rl-rb)<0时,意味着博弈双方采取同种策略的收益低于双方采取不同策略的总收益,而且双方都采取高水平合作时一方采取高水平协作的收益低于双方采取不同策略时一方采取低水平合作的益;

当■时,意味着博弈双方采取同种策略的收益高于双方采取不同策略的总收益,而且双方都高水平合作时一方采取高水平协作的收益高于双方采取不同策略时一方采取低水平合作的收益。

1.2 基于agent建模原理

Agent是代理的意思,在计算机领域被视为一个具有各种属性并且能持续在特定的环境下发挥功能的主体。那么多代理(multi-agent)指的是在特定环境中,多个能持续发挥功能的独特主体,这些代理往往具备自主性、被动响应能力、主动响应能力、时间连续能力和自适应性[15]。Agent在计算机仿真中被应用为一种软件系统,Agent的组成元素以及相应的属性设置可以由具体情境要求而设置,并且各类Agent与之所在环境均存在着某种特定联系,能够感觉到外界发生的变化,各类Agent自身也会根据变化而做出相应的变化[16]。

Netlogo是一种为了分析复杂系统开发的仿真建模软件平臺,主要适用于社会现象仿真建模分析。Netlogo于UriWilensy在1999年研发出来,其研发目的是为给科研教育机构提供一个功能强大但是方便实用的计算机仿真建模工具[17],它能很好地模拟微观个体的行为,从而设立大量群体的仿真行为和宏观模式的涌现及从大量个体仿真中发现个体之间的联系和规律。

1.3 模型建立

本文采用Multi-Agent技术结合演化博弈理论的建模方法,定义产学研合作创新中的学研方和产方以及仿真环境,根据产学研各方主体自身的不同种类的私有属性,以及系统设置的外部环境属性设置。根据演化博弈论设定特定的行为规则和行为选择决策,产学研各方的Agent会在无数次演化博弈过程中根据自身属性随机博弈,同时不断更改博弈的策略,直到最后达到演化博弈的稳定状态。这里的外部环境为产学研合作中的宏观环境,即由政府建立的相关机制,即为对合作行为的奖励和背叛行为的惩罚措施等各项规定。在模拟环境里设置成各种控制变量以及限制机制。按照设定,产学研仿真模型中的各个博弈参与方都假定为一个Agent。演化博弈仿真过程中,各个不同的Agent在仿真系统环境内随机移动。

企业和高校Agent运行机制一样,都有利益和机制驱动,不同的是各自属性要求不同,高校的学术性质和学术要求更浓,而企业转化专利为产品的欲望更加强烈。多个高校与企业的Agent共同对现实进行仿真,解决现状问题。产学研协同创新仿真模拟前提是高校和企业的有限理性。图1为运行流程图。

<学研方Agent>::=<成本><收益><策略行为><历史策略记录>

<产方Agent>::=<成本><收益><策略行为><历史策略记录>

<环境Agent>::=<政策机制><学研方Agent ><产方Agent>

步骤1:通过感知部分获取外部环境信息等,外部环境的搭建:惩罚机制、奖励机制以及相关有可能参与到博弈中的社会其他群体,Agent运行规则里,选择网格活动空间设置,即Netlogo环境中的网格,每一个Agent可以朝网格空间中的任意方向移动;

步骤2:设置学研方和企业方基本属性参数,每一轮博弈代表一个game,每次博弈各方获得的收益为score;

步骤3:根据制定规则和机制,每个Agent在每一段仿真周期t内,会与随机遇到的Agent就会进行博弈,同类Agent不参与博弈行为。在演化博弈仿真模型中,各类Agent都具有自身的独特属性、以及不同的行为规则;

步骤4:每一次演化博弈产生的收益会记录在各个Agent的属性记录里,记录的收益根据所选策略来确定。将本次采用的策略记录下来作为历史策略;

步骤5:重复步骤3,直到得到满足协同效应的稳态,以累积的收益平均分进行归一化来表示是否高水平协同合作,输出结果■

2  仿真实验与结果分析

产学研协同创新合作仿真模型初始化和演化博弈仿真运行均在NetLogo仿真平台之中,根据演化博弈不同的参数设置而设定不同的演化博弈支付矩阵,在社会环境和政府政策的运行后,两类Agent经过一定次数的博弈,直到最终达到协同创新合作行为的演化均衡状态。从产方和学研方两类Agent群体中选择低水平合作和高水平合作策略得分(即收益)的归一化比例曲线来表示产学研合作过程最终演化稳定后的策略大致趋势。本次仿真的网格模拟空间设置为200*200,分别设置政府政策Agent、环境相关Agent以及初始选择策略的博弈双方主体产方Agent个数50个以及学研方Agent主体个数50个。Netlogo仿真的运行最终各方收益均衡图的横坐标x表示仿真周期(即仿真运行的时间),表示系统的运行周期数,纵坐标y=■。仿真运行的结果以达到稳态的时候(实验中为tick)为准,以下仿真都是基于α=0.5,β=0.5 的前提下进行。

情形一:模型的建立和运行在?琢ru-c1u-?琢rb-c1d<0,?琢(ru+rd-rl-rb)运行结果如图2、图3所示。

如图2(a)所示,当市场缺乏奖惩机制、博弈者对未来的折现效应不做考虑时、政府无相关政策去约束不合作的产学研方,或者政府无相关政策去鼓励高水平的合作方时,产学研的各方出于对自己的保护从而选择低水平合作。因为在这种情况下,如果一方选择高水平合作时另一方选择低水平合作,这会导致自己方收益为负。但是由于博弈一开始双方无法知道对方的历史策略,所以有些产学研博弈方也会有选择高水平合作的,如图2(a)所示,高水平合作收益归一化后不会趋于0,而大多数博弈方选择低水平合作行为,这成了趋势,让低水平合作成为协作的主导。当引入市场化时,如图2(b)所示,由于高校和企业的有效沟通产生了信任,或者由于市场相关规则的制定,使得低水平合作显著降低,高水平合作显著上升,但是低水平合作依旧是主流。因为如果足够多的参与者,市场机制就会更加完善,协同效应更加高效。当市场具备足够的奖惩机制时,或者产学研双方都考虑未来的折现效应时,而且有政府相关政策时,如图3(c)低水平协作收益显著降低意味着低水平合作比例降低,高水平合作比例超过低水平合作比例,但是各项政策后由于收益差距不大,低水平合作比例和高水平合作比例差距不大。

情形二:模型的建立和运行在?琢ru-c1u-?琢rb-c1d<0,?琢(ru+rd-rl-rb)<0时,运行结果如图4、图5所示。

如图4(a)所示,当市场机制、博弈者不考虑未来的折现效应时、政府无相关政策时,产学研的各方出于对自己的保护依旧选择低水平合作。当引入市场化时,如图4(b)所示,由于高校和企业的有效沟通产生了信任,或者由于市场相关规则的制定,使得低水平合作显著降低,高水平合作显著上升,但是低水平合作依旧是主流。当市场具备足够的奖惩机制时,或者产学研双方都考虑未来的折现效应时,而且有政府相关政策时,如图5(c)低水平协作收益显著降低意味着低水平合作比例降低,但是由于在情形二下,产学研双方采取不同策略时的收益好于同种策略,低水平合作依旧比高水平合作比例高。

情形三:模型的建立和运行在?琢ru-c1u-?琢rb-c1d>0,则一定?琢(ru+rd-rl-rb)>0,运行结果如图6、图7所示。

如图6(a)所示,当市场缺乏机制、博弈者对未来的折现效应不做考虑时、政府无相关政策时,产学研的各方选择高水平合作去获得更好的收益。当引入市场化时,如图6(b)所示,由于高校和企业的有效沟通产生了信任,或者由于市场相关规则的制定,使得低水平合作显著降低,高水平合作显著上升,但是高水平合作依旧是主流。足够多的参与者使得市场机制就会更加完善,协同效应更加高效。当市场具备足够的奖惩机制时,或者产学研双方都考虑未来的折现效应时,而且有政府相关政策时,如图7(c)低水平协作收益比例变化不大,高水平合作依旧成为主流。

3  结论

在本文的仿真模拟过程中,主要使用了NetLogo仿真建模平台进行博弈论的演化博弈过程仿真,通过控制相关变量的值进行模拟,在演化博弈仿真分析过程中分别对演化博弈过程中做出不同的参数修改来控制仿真的进行,最后直到得出最终的稳态结果。

根据产学研协同创新分析仿真结果,本文可以得出:①复杂环境下,执行各种制度保障有利于产学研协同创新持续发展,保障制度的建立需要从整体上把握协同创新行为模式。如果能对产学研整体系统做出优化调整与部署,这将有助于于协同创新主体在产学研合作博弈过程中选择较为合理的协同行为,完善和规范协同创新网络,从而获得最高的产学研协作收益;②复杂的外部环境决定了实际市场里不会只存在单纯的高水平合作行为,也不会只存在单纯的低水平合作行为,在相关机制下不同的利益分配情况和不同的利益收入状态,可以在一定程度上决定未来是否进行高水平合作还是低水平合作;③协同创新合作过程中产学研博弈各方,都会关注到创新合作之后形成的效益,也会关心受益的公平分配问题;④最后,在产学研协同创新过程中,创新的参与主体之间会根据现实情况而实施多次不同的博弈选择,在这种情况下,有必要设置更多的博弈行为和新的演化博弈矩阵。

参考文献:

[1]蒋元涛,潘亭亭.基于NetLogo平台的产学研协同创新仿真研究[J].科技创业家,2014(03):149-150.

[2]Baldwin C, Von Hippel E. Modeling a paradigm shift :from producer innovation to user and open collaborative innovation[J].Organization Science,2011,22(6):1399-1417.

[3]Inzelt A. The evolution of university-industry-government relation [J].Research Policy,2004,33(6):975-995.

[4]Cohen W M, Nelson RR, Walsh JP. Links and impacts: the influence of Public Research on industrial R&D [J].Management Science,2002,48(1):1-23.

[5]陳劲,阳银娟.协同创新的理论基础与内涵[J].科学学研究,2012,30(02):161-164.

[6]何郁冰.产学研协同创新的理论模式[J].科学学研究,2012,30(02):165-174.

[7]刘晓玲,秦富贞.基于产学研用协同创新的机电类创新创业人才培养模式研究[J].科技风,2019(11):247-248.

[8]肖泽磊,范如国,王松.考虑技术异质性的湖北制造业创新绩效测度与影响因素研究[J/OL].湖北社会科学,2019(03):53-61[2019-04-23].https://doi.org/10.13660/j.cnki.42-1112/c.014997.

[9]覃艳华,曹细玉.粤港澳大湾区城市群科技协同创新研究[J].华中师范大学学报(自然科学版),2019,53(02):255-262.

[10]孙卫东.产业集群内中小企业商业模式创新与转型升级路径研究——基于协同创新的视角[J].当代经济管理:1-8[2019-04-23].

[11]黄婷婷,鲁虹.基于多Agent模型的产学研合作机制研究[J].中国软科学200(S2):237-242.

[12]王文宾.演化博弈论研究的现状与展望[J].统计与决策,2009(03):158-161.

[13]周静波.演化博弈论的基本方法及应用[J].中国城市经济,2012(03):234-236.

[14]陈劲,殷辉,谢芳.协同创新情景下产学研合作行为的演化博弈仿真分析[J].科技进步与对策,2014,31(05):1-6.

[15]王岚. 基于Multi-Agent的分布式应用系统研究[D].首都经济贸易大学,2004.

[16]廖守亿,戴金海.复杂适应系统及基于Agent的建模与仿真方法[J].系统仿真学报,2004(01):113-117.

[17]耿柳娜,李艳.合作行为的NetLogo计算机仿真研究[J].现代远距离育,2011(01):66-69.

猜你喜欢
协同创新
基于协同创新的电子信息类专业应用型本科人才培养模式改革研究
高职院校与企业协同专业建设新机制的实践探索