基于演化博弈的科研行为主体诚信策略研究*

2022-02-06 04:16刘君亮王儒王翠芝
中国科技纵横 2022年22期
关键词:行为主体科研人员收益

刘君亮 王儒 王翠芝

(1.北京交通大学科学技术研究院,北京 100044;2.北京交通大学经济管理学院,北京 100044;3.北京邮电大学人工智能学院,北京 100876)

0.引言

科研诚信是科技创新的基石,是实施创新驱动发展战略、建设世界科技强国目标的重要基础。虽然我国科研诚信建设在工作机制、制度规范、教育引导、监督惩戒等方面取得了显著成效,但整体上仍存在短板,科研项目成员出现失信行为的现象屡禁不止。如何有效促进科研诚信,成为学术界亟待解决的问题。

不少学者围绕科研信用进行了相应的研究,如李艾丹和赵启兰等,他们从国家政策方面出发,提出一套信用评价指标体系[1]。国丽娜等从相关主体的诚信度、合规度和践约度等角度构建了政府科研信用的评估指标体系[2]。肖小溪和李晓轩提出,科研单位和资助单位之间存在信息不对称现象,且在这种现象下的契约合同关系决定了双方的信息不对称问题[3]。袁尧清详细分析了我国科研行为信用评价体系目前所存在的问题,并结合管理学的理论提出了切实可行的科研诚信评估方案[4]。熊小满从信息分享角度,指出了我国科研信用信息的共享程度不够,由此引发了较多的科研失信问题[5]。张明龙和张琼妮从惩罚角度对失信行为进行了研究,在惩罚中综合考虑了执行者、评价者和管理者对失信信息的利用[6]。段华平研究了现代契约机制与科研项目管理的关系,并提出了契约机制在一定程度上可以遏制失信行为的发生[7]。

以上学者在研究科研人员信用问题时,多从信用指标构建、法律法规制定、契约关系设置以及信息共享等方面展开,并未考虑到科研人员自身所存在的不完全信息以及不完全理性问题。因此,当前研究还存在一些不足之处。而博弈理论可以综合考虑到以上两种问题,更全面地描述科研人员信用行为,分析其背后的失信机理。当前,学术界在信用研究方面已有部分学者利用博弈理论展开研究。王性玉等通过建立信号传递博弈模型分析了抵押品替代与农户信贷可得之间的内在作用机理[8;游宗君等基于小额信贷机构进入市场的先后顺序,构建了策略选择的竞争博弈模型[9];王惠和王静在有限理性假设下,对比分析了银行和农户之间有无合作社的情况下的最终演化趋势,以及借贷双方的策略选择变化情况[10];赵成国和李萌运用委托代理理论,研究了P2P网贷平台的演化博弈均衡以及最终的演化趋势[11];夏鹏和高辉研究了政府部门和私营部门两者的演化博弈均衡,分析了社会监管力度对演化均衡的最终影响[12];张娟等把演化博弈模型应用在网络销售商之间的信用关系演化当中,通过模型对网络销售商信用治理进行研究[13];肖莎等在小微企业融资的基础博弈模型上,提出可以利用信用评级和惩罚成本来降低企业的信用贷款风险[14];博弈理论在信用研究上的广泛应用说明了该方法的有效性,但目前在科研信用方面还少有学者应用博弈论的方法对其进行研究。鉴于演化博弈论在该领域的适用性,该理论可为科研行为主体在信用监管上提供理论支撑。

故本文在之前学者的研究基础上,综合考虑了科研行为主体间的有限理性以及不完全信息等问题,采用演化博弈分析了利益驱动下的科研行为。通过构建两组科研行为主体的演化博弈模型,分析科技研发中诚信策略的稳定性、演变趋势及演化稳定点,研究诚信科研成本、不诚信科研风险等要素对科研行为演化均衡的影响;再将监管部门参数化后加入到改进的模型,进一步分析了监管部门对演化均衡策略的影响和各影响因素对博弈演变的影响灵敏度,为提出推动诚信科研策略建议提供依据。

1.博弈模型构建

针对模型做如下假设:

(1)假设主体信息是完全公开的,即各主体间能够完全了解彼此特征的差异、战略选择空间和收益支付函数的不同。科研行为主体由于人数与项目能力不同,分为A类和B类,策略集合均为(诚信,不诚信)。A类科研人员的项目数为n1,B类为n2,基准收益与项目数量成正比。

(2)假设各科研行为主体中的人员均处于有限理性,会根据群体收益情况合理调整自身的策略选择。

(3)监管部门可以从联合奖惩角度对科研人员的守信情况实施奖惩。监管部门作为独立于各科研行为主体的第三方组织,需秉持公平公正监管的同时,还需要对失信人员实施严厉处罚,增大其失信成本,进而减少失信行为的发生,针对A类项目组的惩罚值P1(P1≥0),对B类项目组给予惩罚值P2(P2≥0)。

(4)当A类科研行为主体和B类科研行为主体都采取诚信科研行为时,此时呈现诚信局面,但是A、B两个项目组会产生一定的诚信科研成本C,这里假设,A类项目组的科研成本αC,B类项目组的科研成本为(1-α)C。

(5)当A类科研行为主体与B类科研行为主体其中一个选择诚信科研,另一个选择不诚信科研时,两个科研行为主体之间会产生一定的项目数量转移。假设A类科研行为主体采取诚信科研策略,B类科研行为主体采取不诚信科研策略时,A类科研行为主体会损失S1,B类科研行为主体会增加S2,反则亦然。

由于策略集合的组合不同,会产生以下4种不同的策略情况:

(1)当A类科研行为主体和B类科研行为主体都采取诚信科研策略时,两个科研行为主体都会通过自身的努力将增加总体项目数量转化并获得收益,设增量分别为n3和kn3。在不影响基础假设的情况下,设二者的收益率分别为r1和r2,科研行为主体的成本为C,并在两类科研行为主体之间按照α和1-α的比例进行分配。因此,A类科研人员的收益为(n1+n3)r1-αC,B类科研人员的收益为(n2+kn3)r2-(1-α)C。

(2)当A类科研行为主体选择诚信科研策略而B类科研行为主体选择不诚信科研策略时,对应的收益情况为:A类科研行为主体收益:n1r1-αC-S1,B类收益为n2r2-T2+S2-P2,这里T2表示B类科研行为主体选择不诚信策略时产生的成本,且T2<(1-α)C。

(3)当A类选择不诚信而B类选择诚信时,对应的收益情况为:A类科研行为主体:n1r1-T1+S1-P1,B类科研行为主体:n2r2-(1-α)C-S2,这里T1表示A类科研行为主体选择不诚信策略时产生的成本,且T1<αC。

(4)当A类科研行为主体与B类科研行为主体都选择不诚信科研策略,会导致双方项目收益发生改变。A类科研行为主体:(n1-hΔn)r1-T1-P1,B类科研行为主体:(n2-hΔn)r2-T2-P2,收益的变化主要是由项目数量引起的,比例系数h是一个介于-1和1之间的数,相应收益变化量为 |hΔn|。

A类科研行为主体与B类科研行为主体选择诚信科研的概率分别为x和y,反之不诚信科研的概率为(1-x)和(1-y)。根据对博弈双方的假设,我们可以得到A类与B类科研科研行为主体的支付矩阵,具体如表1所示。

表1 监管部门调控下科研行为主体支付矩阵

2.博弈模型分析

在监督管理部门激励机制下,两类项目组支付结果的复制动态方程如下:

A类科研行为主体:

B类科研行为主体:

令G(x)=0,G(y)=0,可以得到:在平面N={(x,y);0≤x,y≤1}上,科研行为主体间的策略博弈有5个局部均衡点,分别是O(0,0),A(1 ,0),B( ,1),C(0,1)和鞍点D(xD,yD)。其中,。

根据前文的分析,我们求得了5个均衡点,从Jacobian矩阵(记为J)分析得出系统的演化稳定策略。

如果同时满足以下两个条件,则可判断为演化稳定策略。

①trJ=α11+α22<0(迹条件);

表2 局部均衡点处a11、a12、a21和a22的取值

这里,

应用系统平衡点的判断局部稳定性,可以得到当P1、P2均满足:且同时满足,

P1>αC+S1-hΔnr1-T1或P2>S2+(1-α)C-hΔnr2-T2,稳定点将为(1,1)。即A类科研行为主体与B类科研行为主体都选择诚信科研策略,说明此时监管部门的惩罚对于A类科研行为主体与B类科研行为主体都是有效的,稳定性情况为(0,0)是不稳定点,(0,1)和(1,0)是鞍点,只有(1,1)是演化稳定点。

综合前文分析结果,可以绘制出博弈双方的策略演化相位图,如图1所示。

图1 科研行为主体行为选择演化相位图

图1描述了A类科研行为主体与B类科研行为主体的博弈过程,其中折线ADC作为临界线划分出系统所收敛的不同状态,右侧ABCD部分收敛于(诚信科研,诚信科研),即(1,1)点。左侧ADCO部分收敛于(不诚信科研,不诚信科研),即(0,0)点。

可见,在科研行为主体行为在无监管或少监管的情况下,A类科研行为主体与B类科研行为主体的最终演化均衡点取决于SABCD和SADCO的面积大小。若SABCD>SADCO,系统将更可能向诚信科研的方向演化;若SABCD<SADCO,系统将更可能向不诚信科研的方向演化;若SABCD=SADCO,策略选择概率相等,演化方向不确定。根据图3得出区域ADCO的面积为:。

影响SADCO的参数均与SADCO为单调关系,其对于科研行为主体信用策略的演化方向的影响情况为:科研风险S1、不诚信科研成本T1和惩罚值P1的减少,会导致y*的下降,进而使得SABCD增大,演化稳定点向(诚信,诚信)方向演进;科研风险S2、不诚信科研成本T2和惩罚值P2的减少,会导致x*的下降,进而使得SABCD增大,演化稳定点向(诚信,诚信)方向演进;诚信科研成本C的减少,会导致x*和y*的下降,进而使得SABCD增大,演化稳定点向(诚信,诚信)方向演进。

可以看出,通过减少科研行为主体的诚信科研成本、诚信科研风险和增加科研行为主体的不诚信科研成本与惩罚,能够使A类与B类项目组更趋于互相选择诚信科研,利于科技发展。

3.结论

科研诚信是科技创新的基石,如何对科研人员的信用水平进行有效监管是推动科研诚信建设的重要途径。本文综合考虑科研项目成员间的有限理性、不完全信息以及各类科研人员的收益情况,并考虑各自的风险偏好程度,构建了演化博弈模型,通过算例进一步分析了各影响因素对博弈演变的影响灵敏度,研究得出以下结论:

(1)项目组的博弈均衡演变受到不同因素影响,与诚信科研成本、诚信科研风险、诚信科研收益增加率、不诚信科研收益以及相应成本等因素有关。监管部门的存在,可以通过调节诚信科研成本、诚信科研风险、诚信科研收益增加率、不诚信科研收益率以及相应成本,促进科研行为均衡点向诚信科研方向演化。重视对于科研人员科研行为的监管与干预,强化监管行为,完善监管体系,优化监管效果,可以有效减少科研失信行为。

(2)不同影响因素对科研行为主体策略选择的影响方向不同。诚信科研成本、诚信科研风险、不诚信科研收益等因素,对科研行为主体选择诚信科研行为策略具有负向影响;科研行为主体的不诚信科研成本、诚信科研收益增加等因素对科研行为主体选择诚信科研行为策略具有正向影响。监管部门可以通过降低负向影响因素值,提高正向影响因素值,推动科研行为主体的诚信科研行为。

(3)不同影响因素对科研行为主体策略选择的影响程度不同。影响科研行为主体策略选择的因素中,诚信科研行为收益率影响程度最大,诚信科研成本影响较大。监管部门可以通过提高科研行为主体收益转化率、降低诚信科研成本,进而降低诚信科研风险,促进科研行为主体选择诚信科研策略。

猜你喜欢
行为主体科研人员收益
科研人员破译黑猪肉特征风味物质
螃蟹爬上“网” 收益落进兜
治疗艾滋病,中国科研人员有了新发现
广东公安科研人员风采
会计政策选择行为的心理学分析
——基于计划行为理论的解释架构
财政违法行为及监督的演化博弈分析
怎么设定你的年化收益目标
网络政治参与相关问题辨析
2015年理财“6宗最”谁能给你稳稳的收益
言语主体与庭审转述行为主体的多元同现