中国人工智能发展评价指标体系构建与实证测度

2023-11-13 03:45马光威钟玉婷
科技管理研究 2023年18期
关键词:测度省份指标体系

马光威,钟玉婷,钟 坚

(1.东莞理工学院经济与管理学院,广东东莞 523106;2.深圳大学经济学院,广东深圳 518061)

1 研究背景

近年来,以人工智能(AI)为核心的第四次科技革命呈现出爆发式发展态势,对人类社会活动产生了巨大影响。中国2017 年7 月发布的《新一代人工智能发展规划》将发展人工智能提升至国家战略高度,与此同时,国内各地方政府也不断加大科研投入力度,积极布局人工智能产业,建设人工智能产业园区,而各地高校也不断增设相关学科专业,各类发明专利不断涌现。主动了解和掌握人工智能目前发展情况及其未来发展方向,对中国战略层面人工智能研发布局至关重要。

基于数字科技的机器学习技术不断突破,由此推动了人工智能产业快速发展,中国在人工智能领域也取得了大量技术进展。国内学者很早便对人工智能发展水平进行了关注,并围绕这一主题开展研究,如王洪庆等[1]、陶长琪等[2]、陈明艺等[3]的研究。相对简单的人工智能发展水平度量方法主要有以下两个方向:一是使用已经实现自动化的生产任务占所有生产任务的比重反映人工智能发展程度,如郭凯明[4]、程承坪等[5]、王瑞瑜等[6]的研究;二是假设人工智能发展使生产函数中出现了与普通资本不同的智能资本,然后通过智能资本及其变化来刻画人工智能的发展程度,如陈利锋等[7]、黄旭等[8]、程惠芳等[9]的研究。部分专业机构则聚焦于人工智能发展水平测度问题展开研究,如乌镇智库[10]自2016 年起连续多年从产业、技术、应用场景3 个维度汇总全球人工智能发展数据;2018 年,清华大学中国科技研究中心[11]发布《中国人工智能发展报告2018》,从科技产出与人才投入、产业发展与市场应用、发展战略与政策环境、社会认知与综合影响等4 个维度对国内人工智能发展水平进行测度;2019 年,国家工业信息安全发展研究中心发布《中国人工智能产业发展指数》,从基础支撑、创新能力、融合应用、产业运行、环境保障5 个维度对人工智能产业发展情况进行综合评价[12]。相比之下,学者们的研究则更加细化,如李旭辉等[13]运用纵横向拉开档次法、非线性规划法对我国三大支撑带人工智能产业自主创新能力进行测度,熊曦等[14]、王宏起等[15]、李旭辉等[16]也做了类似研究;郝力晓等[17]通过熵权法,从制度环境、基础设施、技术创新与生产应用4 个维度测度了2003—2018 年中国各省份人工智能发展指数;匡祥琳[18]则采用主成分分析法,基于2010—2020 年中国30 个省区市面板数据,对其人工智能技术创新水平进行测度;顾国达等[19]构建了以环境力、知识创造力、产业竞争力为主的人工智能综合发展指数体系,同时运用组合赋权法和时序加权平均算子对2010—2018 年中国、美国、欧盟、日本、韩国、加拿大等国家和地区的人工智能发展水平进行量化评估,孙早等[20]、王山等[21]也开展了类似研究;陈凤仙[22]则从经济学视角切入,对人工智能发展水平测度相关文献进行全面梳理,归纳总结了人工智能的综合发展水平、渗透率及其对经济各领域影响程度的测度方法。

综上,现有研究成果更多采用较为单一或相对简单的指标对人工智能发展水平进行替代研究,也有学者如郝力晓等[17]尝试构建相对完善的测度指标体系对其发展进行研究,但遗憾的是,当前学术界尚未构建相对科学的指标体系测度人工智能发展水平,导致相关研究缺少量化分析基础;加之中国的人工智能发展尚处于初级阶段,统计数据稀缺,因而其发展水平的测度难度较大,仍有待进一步探索。

为了更好地了解中国各省份人工智能发展水平,本研究围绕人工智能发展的表征与影响展开分析,并着重考察以下问题:第一,人工智能发展水平测度指标体系设计思路是什么,哪些指标更适合衡量中国人工智能发展状况?第二,哪种方法对中国省域人工智能发展水平测度更适用?第三,2020 年中国各省域人工智能发展水平如何,有哪些政策启示?

2 指标体系构建与测度方法选择

借鉴钟玉婷等[23]的研究,按照事物发展的“事前—事中—事后”的逻辑顺序,在明确中国人工智能发展水平测度指标体系设计思路与指标选取原则的基础上,构建一个“三维四层”的人工智能发展水平测度指标体系。由于西藏和港澳台地区人工智能相关数据缺失较多,因此只对中国30 个省份的人工智能发展水平进行测度研究。

2.1 指标体系构建

2.1.1 指标体系设计思路

借鉴李旭辉等[24]的研究中关于指标体系构建的思路,拟定人工智能发展水平测度指标体系的构建框架为“三层四维”,其中“三层”指一级、二级、三级指标;“四维”指创新支撑、技术成果、成果应用、创新实践4 个维度。具体如下:一是创新支撑,指能够直接或间接参与到创新过程中的活动因素。该维度侧重衡量人工智能创新趋势和持续性能力,指标设计考虑主要在宏观层面测度。二是技术成果,指人工智能技术创新的直接成果输出。因为直接技术成果不仅是作为创新技术的物化显示,同时也是引领创新驱动发展的主要载体,代表先进技术的前进方向。该指标设计综合考虑了相关企业、科研机构以及高校专利发明与科研论文输出。三是成果应用,指人工智能技术成果的社会价值。由于成果应用被作为检验技术能否为社会创造价值的最佳途径,因而在衡量国家或地区的人工智能发展水平时,不仅要考虑到其发展所依托的创新环境及其创新质量,还要明确其知识创造、传播及应用贡献度,因而成果应用更侧重创新成果的场景适用性。相关指标设计主要考虑研究成果的生产转化或消费转化。

2.1.2 指标选取原则

立足于数据的可获得性和指标测度的时效性,围绕中国各地社会经济发展的现实基础,构建如下三级指标的选取原则:一是匹配性原则,即指标需要与测评内容相匹配。一方面,各维度指标需要与相应二级指标测评内容相匹配,支撑二级指标的测评目的;另一方面,三级指标作为测度指标体系的基础层内容,内容设计需要考虑与现实活动的匹配。二是适用性原则,即指标需要适用于中国宏观层面和省域层面,同时考虑到人工智能发展的技术特征,也需要适用于人工智能软硬件结合的技术特点。三是可获得性原则,即指标测度所需数据可通过搜集整理获得。鉴于目前中国人工智能发展实际,数据可获得性为本研究的指标选取重要原则。研究数据大多来源于《中国科技统计年鉴》《中国人工智能产业发展指数》等,部分数据则采用互联网数据处理技术进行抓取与解析。

2.1.3 指标体系

结合上述人工智能发展测度指标体系的构建思路与指标选取原则,借鉴由英特尔AI 百佳创新激励计划、德勤人工智能研究院和深圳人工智能行业协会联合发布的《中国成长型AI 企业研究报告》[25],深圳市人工智能行业协会[26]发布的《2021 人工智能发展白皮书》,清华大学人工智能研究院、清华-中国工程院知识智能联合研究中心[27]联合发布的《人工智能发展报告2020》,以及中国科学技术发展战略研究院[28]发布的《中国区域科技创新评价报告2021》等的相关指标体系,设计了包含4 个一级指标、10 个二级指标与32 个三级指标的人工智能发展水平测度指标体系,具体如表1 所示。

表1 中国人工智能发展水平测度指标体系

2.2 测度方法选择

根据文献回顾可知,当前关于人工智能发展水平测度方法主要有基于截面数据的静态综合测度方法与基于面板数据的动态综合测度方法两种,分别如张彬等[29]和顾国达等[19]的研究,测度过程均涉及指标的加权计算。对于截面数据,常见指标权重确定方法是因素分析法和熵权法。其中,因素分析法是通过因子分析法或主成分法计算指标权重,有如刘俊显等[30]、林海明等[31]的研究;而熵权法则常用于计算分项权重,衡量指标的相对差距,如张俊光等[32]、禹春霞等[33]的研究。对于面板数据,常见指标权重确定方法为纵横向拉开档次法,即针对时序立体数据的动态测度方法,基本原则为最大化立体数据来体现各评价对象之间的差异,采用求解非线性规划问题思路逐层确定指标权重[34]。熵权法是基于信息熵的多对象、多指标客观赋权方法,通常根据指标的离散程度判断其对综合评价结果的影响,计算过程仅依赖数据本身,可以有效避免人为干扰而产生的主观偏差[33]。鉴于2020 年之前相关数据缺失严重,2021 年之后部分数据尚未公布,考虑到本研究中32 个指标的时间序列数据搜集的难度,因此采用熵权法,利用指标权重测度2020 年中国人工智能发展水平指数。具体方法如下:

(1)建立指标矩阵。首先,设定含m个指标与n个测度区域的指标矩阵,其中代表第j个测度区域的第i个指标;其次,考虑到指标数据存在负值的可能性,采用min-max 标准化方法对原始矩阵进行处理,得标准化矩阵。

(2)计算指标熵权。对三级指标定义信息熵为:

以信息熵为基础计算指标熵权值为:

(3)综合测度。采用熵权法对各省份人工智能发展水平进行综合测度。

3 中国人工智能发展水平测度

3.1 数据来源

由于某些指标数据统计可能存在时间段差异,如相关政策实施周期、人工智能实验室建设周期等,故在进行数据收集时,设定含2020 年的时间段均纳入到数据统计范围。测度数据主要来源渠道分为3 种:

一是政府各机关单位组织数据公布的官方网站。相关支撑政策数量、金融扶持政策数量、人工智能专项扶持资金等测度指标的数据来源于各省份人民政府网站和工业和信息化管理部门网站,以及各省份科技管理部门等官方公布信息,统计内容主要为政府各机关单位发布的相关政策,政策实施时间含2020 年;国家重点研发计划指标数据来源于科学技术部2021 年公布的“2020 年国家重点研发计划重点专项立项公示”[35],主要统计内容包括智能芯片研发计划数、人工智能软件开发项目数以及互联网协同智能工业化制造技术研发项目数等;市级以上人工智能实验室数量指标数据来源于各省份的《国民经济和社会发展统计公报》《国家重点实验室年度报告》等,统计内容为国家重点实验室数量,统计截至2020 年年底;高校相关学科数量指标数据来源于百度百科,统计内容为2020 年各省份高校人工智能专业数。

二是社会公开认可的权威机构。自主创新能力指标值数据来源于《中国区域创新能力评价报告2021》中2020 年区域创新综合效用值[28];私募股权投资基金规模指标数据来源于中国证券网,统计内容为2020 年私募基金规模;“人工智能+”发展成效指标数据来源于东方财富Choice 数据库和《中国统计年鉴2021》,用各省份上市人工智能企业当年利润总额除以当年国内生产总值(GDP)作为2020 年各省份人工智能企业贡献度来衡量;人工智能产业园区数量和人工智能产学研基地数指标数据均来源于前瞻产业园区库,前者的统计内容为2020年各省份智能园区数、大数据园区数以及机器人园区数之和,后者的统计内容为2020 年各省份的人工智能机器生产基地数、人工智能产学研基地数以及人工智能产教融合创新基地数的总和。

三是国家统计局统一汇总公布的统计年鉴。数据来源于各类统计年鉴的有关指标(见表2),其中专业会议/论坛主办数量数据来源于《中国科技统计年鉴2021》和各省份2021 年统计年鉴,囿于数据统一性原则,故对该指标2020 年缺失的数据统一用0替代,统计内容为2020 年各省份科技类学术交流会。

表2 中国人工智能发展水平测度指标及其定义与计算方式

3.2 测度结果

利用Stata 16 软件对30 个省份的人工智能发展水平进行综合测度,具体结果见表3,可知广东的人工智能发展水平综合测度结果居第一,江苏紧随其后,而北京为第3 位;相比之下,宁夏居第30 位,与广东存在较大差距。

表3 2020 年30 个省份人工智能发展水平综合测度结果

根据对各省份的人工智能发展水平进行分维度测算可知(见表4),广东在创新支撑、技术成果、成果应用与创新实践4 个维度的人工智能发展水平均位居第一;宁夏的创新支撑维度位于第30 位;青海的技术成果、成果应用与创新实践3 个维度居于末位。可见,分维度测度结果与总体测度结果基本一致。

表4 2020 年30 个省份人工智能发展水平一级指标测度结果

4 中国人工智能发展水平分析

4.1 总体分析

2020 年,30 个省份人工智能发展水平测度结果的阈值区间为[0.010 7,0.832 2],其中广东处于阈值上限,而宁夏处于阈值下限,不同区域间的差异呈现出明显规律性。具体来看,省域人工智能发展具有区域不平衡、对经济增长依赖性强和“东高西低”等三大特征。首先,不同省份之间人工智能发展水平存在严重的不平衡性。其中,综合值居全国第30 位的宁夏与排名第一的广东之间相差约78倍;且除广东的综合值超出0.5 之外,北京与江苏较为接近,均超过0.3,有13 个省份处于0.05 以下。其次,不同省份的人工智能发展水平与其经济总量之间存在明显线性相关,经济总量较高的省份的人工智能发展水平相对较高。为进一步考察区域人工智能发展水平与区域经济总量之间的相关关系,以各省份的综合测度值和经济总量为变量,构建线性拟合方程对两者之间的相关性进行检验,结果如表5 所示,两者之间存在显著的正相关关系,线性拟合优度大于50%,一定程度上说明经济总量越高的地区,其人工智能发展水平相对较好。第三,人工智能发展水平呈现出明显的“东高西低”特征。除了省份之间人工智能发展存在不平衡性,即使经济体量较为接近的省份,同样是处于东部沿海地区的人工智能发展水平优于处于中西部地区,其中东北地区表现尤为明显,如江西与辽宁GDP 总量较为接近,但二者的人工智能发展水平综合测度值相差1倍以上,且类似的情况较为普遍,笔者认为可归因于东部沿海地区更容易接触到国外的技术转移,技术创新与实践的市场激励也更大。

表5 2020 年30 个省份人工智能发展水平与其生产总值的相关性检验结果

4.2 分维度分析

通过计算可得,30 个省份人工智能发展水平的创新支撑、技术成果、成果应用与创新实践4 个维度的熵权值分别为0.227 2、0.163 6、0.178 7、0.430 5,可见创新实践对整体发展水平的贡献最大,创新支撑次之。进一步研究发现,综合测度值排名靠前的几个省份的创新实践也表现较好,创新支撑力度也足够大。为更加直观地呈现出上述4 个维度的差别,绘制分区域的分维度层面测算结果散点图(见图1)。从创新支撑维度来看,广东、北京与江苏分居前三,其中广东遥遥领先,评价值为0.201 3,而除川渝之外的广大西部及东北地区的多数省份的测度结果小于0.010 0,与综合测度结果一致,存在明显的区域不平衡性。从技术成果维度来看,与创新支撑维度一样,广东、北京与江苏分居前三,西部地区的青海、海南、宁夏、内蒙古、新疆、甘肃、贵州、云南等省份的评价值较低,青海的情况尤为突出,主要是由于这些地区的人工智能技术成果输出较少。从成果应用维度来看,广东、江苏、浙江分居前三,北京则降至第12 位,而西部地区及东北地区的青海、黑龙江、甘肃、吉林、内蒙古、宁夏、新疆等省份的评价值相对较低。从创新实践维度来看,广东、北京与江苏分居前三,其中广东遥遥领先,评价值为0.334 2,青海、内蒙古、宁夏、新疆、甘肃、黑龙江、云南等省份的评价值较低。由此可见区域人工智能发展水平“强者恒强”的发展特征。其中,广东、北京、江苏、上海、浙江、山东等省份的4个维度均表现优秀,而西部地区及东北地区的部分省份的4 个维度均表现较差;创新实践与创新支撑维度对综合值的贡献要远超其他两个维度,综合评价结果表现优秀的广东、江苏、北京、浙江等4 个省份的创新实践维度表现优于其他维度,紧随其后的上海、山东,其创新支撑维度的表现优于其他维度。

图1 2020 年30 个省份人工智能发展水平四大维度评价结果

5 结论与政策启示

本研究围绕人工智能发展构建了适用于中国人工智能发展水平测度的“三层四维”指标体系,并采用熵权法对中国30 个省份人工智能发展水平进行测度。结果显示,各省份的人工智能发展水平并不是一致的,而是与其经济体量之间存在着显著的线性关系,经济体量越大的省份,其人工智能发展水平也相对较高;同时,人工智能发展水平存在严重的区域不平衡,明显呈现出“东高西低”的发展特征,即使是经济体量较为接近的省份,东部沿海地区省份的人工智能发展水平还是要优于中西部地区的省份;此外,创新支撑、技术成果、成果应用与创新实践4 个维度的测算结果也与经济综合发展水平存在正向相关性,即经济综合发展越好的省份,其人工智能发展水平的4 个维度也表现较好,且呈现出“强者恒强”的特征,其中广东、江苏、北京、浙江4 个省份创新实践维度表现尤其优秀。

根据以上结论,对中国人工智能发展提供如下建议:(1)统筹全国人工智能产业发展政策,实现各省份人工智能的错位发展。一方面,中国各省份经济发展水平存在较大差距,对人工智能发展的投入力度也存在较大差异,另一方面,各省份人工智能发展的侧重点也不同,因此,强调全国统一全面推进人工智能发展显然不太现实,需统筹区域性人工智能发展引导政策,鼓励不同地区因地制宜地制定人工智能发展路径。(2)建立健全东部与中西部的人工智能发展差异化投入机制。目前中国人工智能发展仍处于起步阶段,各省份应结合各自经济发展状况,积极捕捉发展机遇,东部地区应加强创新支撑维度与技术成果维度的投入力度,而中西部地区应加大成果应用维度与创新实践维度的投入力度,建立跨省域差异化、协同化投入机制。(3)加强技术成果的研发激励力度,提升技术成果输出能力。人工智能发展作为一种具体的技术进步形式,对社会生产生活均存在巨大影响,而技术成果的输出是实现生产生活应用的必然手段,无论是东部、中部还是西部,技术成果的输出都是至关重要的,因此,要加大技术成果的研发激励力度,增加人工智能产品的产出,更有利于实现人工智能技术进步影响的社会价值。

猜你喜欢
测度省份指标体系
三个数字集生成的自相似测度的乘积谱
R1上莫朗测度关于几何平均误差的最优Vornoi分划
非等熵Chaplygin气体测度值解存在性
Cookie-Cutter集上的Gibbs测度
谁说小龙虾不赚钱?跨越四省份,暴走万里路,只为寻找最会养虾的您
层次分析法在生态系统健康评价指标体系中的应用
供给侧改革指标体系初探
因地制宜地稳妥推进留地安置——基于对10余省份留地安置的调研
测土配方施肥指标体系建立中‘3414
土地评价指标体系研究