基于熵值修正PLS权重的图书情报领域作者影响力综合评价研究

2019-02-18 02:10

图书馆研究与工作 2019年2期

（达州图书馆四川达州 635000）

科研人员学术影响力的评价问题一直是国内外学者关注的重要问题，其评价结果对识别领域内核心作者具有重要意义。Hirsch教授结合“质”和“量”提出h指数，受到广泛的认可与应用[1]。随着对h指数的研究逐渐加深，国内外学者又提出诸多h指数衍生指数以期实现更为精准的学者评价。在指标选取上，基于作者合作的hm指数[2]、hp指数[3]、GN-C指数[4]等；考虑高被引论文的g指数[5]、R指数[6]等；时间维度的AR指数[6]、s指数[7]等。在研究方法上，利用灰色关联法综合时间、合作、期刊影响因子等分析作者影响力[8]；基于特征因子算法对作者引用网络分析量化作者影响力[9]；采用知识关联网络从评价内容、指标与流程维度评估作者影响力[10]；基于DEA和AHP方法对科研人员绩效进行评价等[11]。可以发现，上述大多数研究主要针对一个或多个变量，研究方法也较为陈旧。此外，由于领域作者影响力量化的复杂性，单一评估指标所蕴含的信息量有限，导致评价结果存在片面和局限。某位作者的学术影响力是多重指标综合而成的结果，因而需要一种综合的多属性评价工具。

结合以上讨论，本文尝试性将偏最小二乘法（partial least squares，PLS）方法运用到领域作者影响力量化中。在利用PLS模型确定评价指标外部权重系数基础上，利用熵值法对权重系数进行修正以避免决策者的主观判断而导致权重偏倚。随后，在确定参数指标最终权重基础上，利用图书情报作者数据进行实证分析。最后，详细讨论基于熵值修正PLS模型计算结果与h指数、g指数在作者名次变化稳定性和作者区分性，以探讨将熵值法、PLS方法综合应用于科研人员影响力评估的可行性。

1 领域作者影响力评估指标选取

1.1 影响力指标确定

h指数结合了作者发文的“质”（论文被引频次）和“量”（论文数量），是目前评价作者学术影响力的经典指数[1]。作为h型指数之一，g指数重点考虑了高被引文献作用，其合理性与接受程度仅次于h指数[5]。对科研人员学术成就的影响因素分析、整合，本文选取了h指数、g指数、总被引频次、篇均被引频次、高被引论文数等14个指标作为本研究构建的模型观测变量，具体如表1所示。

借鉴黄贺方以及王妍的相关研究[12-13]，本文将14个影响力指标分为以下三类：论文数量、高被引论文数量等指标构成的产出指标；h指数、g指数等指标组成的引文指标；总下载量、篇均下载量等指标组成的传播指标（见表1）。

表1 领域作者影响力评估指标

1.2 数据来源与标准化

本文以中国知网为数据唯一来源，检索过程中以学科为“图书情报与数字图书馆”，来源类别设定为“全部期刊”，时间范围设定为“截至2016年12月31日”，40位作者的题录数据全部以Excel表格单独保存，具体包括题名、下载次数、被引次数、时间以及作者等。

由于部分指标数值较大（总被引频次、总下载量等），与h指数等指标相差非常悬殊。因此，为避免指标差距过大造成的结果偏颇，本文对上述指标进行0-1的标准化处理，见公式（1）。其中，zj是评价指标j的初始数值，max（zj）是数据集中的最大值，min（zj）是数据集中的最小值，yj是评价指标j标准化后的数值。

2 领域作者影响力PLS模型构建

2.1 初始模型构建及指标筛选

基于以上讨论，本研究构建了科研人员学术影响力评价的PLS模型（见图1）。在PLS模型中，以“产出指标、引文指标、传播指标”作为潜在观测变量，以“综合影响力”为外部潜变观测量。根据Wetzels M等提出的复合结构方程模型[14]，本文的“综合影响力”通过潜在观测变量间接实现度量。

图1 科研人员影响力评价初始及修正模型

由于PLS方法适合小样本量的数据分析、不要求数据服从正态分布、融合多种统计学数学分析方法、可对评价指标进行筛选[15-16]等优点，所以本研究采用PLS方法构建科研人员影响力评价模型。

本研究利用smart-PLS 2.0软件中的迭代抽样方法分别计算了评价指标的T值，设置迭代次数为2 000，计算发现指标“篇均下载量”对综合影响力的显著性T值小于1.96的阈值，说明篇均下载量不能有效解释综合影响力，因而删除该指标。最终，本文确定领域作者影响力评价体系由产出指标4个因素、引文指标5个因素和传播指标4个因素组成。

2.2 影响力评价模型有效性检验

本文从内容有效性、内容一致性、内容区分性以及模型适配度4个方面检验领域作者影响力模型是否有效。

（1）有效性维度上，本文选取的科研人员影响力指标充分借鉴已有成果，且通过PLS模型修正，可以认为评估指标满足内容有效性要求[17]。

（2）一致性维度上，本文选取组合信度（CR，composite reliability）、克朗巴哈系数（Cronbach's alpha）、平均方差提取率（AVE，average variance extracted）、因子共同度（communality）4个指标来评估领域作者影响力模型的有效性。结合表2，4个变量指标的CR和Cronbach's alpha全部大于0.85，且产出指标、传播指标、引文指标、综合影响力的AVE都大于0.6，说明本文构建的模型具有良好的一致性。因子共同度（communality）是衡量潜在变量对度量变量的反映效果。结合表2，4个潜在变量的因子共同度均大于0.6。

表2 评价模型相关参数值

（3）内部区分性维度上，潜在变量的AVE平方根要大于0.5，且同时要大于该变量与其他变量之间的AVE平方根。从表3可知，除综合影响力外，其他3个指标的值都大于各自与其他潜变量的相关系数。因此，4个变量的内部独立性较好，且变量之间具有明显的区分性。

（4）模型适配度方面，本文选取GoF值来衡量整体模型的预测效用和结构模式，见公式（2）。一般认为，GoF值为0.1、0.25、0.36是模型适配度低、中、高的阈值[14]。根据公式（2），计算可知本文作者影响力PLS模型适配度为0.435的强适配度。因此，本文构建的PLS模型适配度较强，可以实现较准确的科研人员评价。

表3 AVE平方根

利用smart-PLS 2.0软件计算各指标之间的相关系数、显著性值，见图1及表4。产出指标的路径系数及显著性T值为0.396（T=8.208），引文指标为0.401（T=6.113）、传播指标为0.339（T=18.859），全部在0.001阈值下正相关，其中引文指标对领域作者影响力的贡献度最高。

表4 科研人员学术影响力评价参数值

从表4数据可知，产出指标与论文数量的相关性最强（0.973），相关性大于0.9的还有论文数量、核心论文数等指标。引文指标与参数g指数的权重系数最强（0.989），与篇均被引频次的相关关系最弱（0.760）。传播指标与最高下载量的权重系数最弱（0.634），与总下载量、合作者数量和被引成果数的相关系数都大于0.85，与总下载量的相关系数最强（0.965）。综合影响力与总被引频次、总下载量的路径系数最高（都为0.938），与篇均被引频次的相关系数最低（0.332）。综合影响力与总被引频次、总下载量的外部权重最大（0.119），与篇均被引频次的系数最小（0.042）。

2.3 基于熵值修正PLS指标权重

“熵”的概念来自于热力学，是评估系统状态不确定性的一种指标。在信息论理论中，信息是衡量系统有序程度的一种指标，而“熵”是衡量系统无序程度的一种指标，二者之间是一种符号相反但绝对值相等的关系[18]。根据此性质，可以通过备选方案提供的固有数据信息，通过熵值法计算各评估指标的信息熵。信息熵越小，说明信息的无序程度越低，其信息的效用价值越大，进一步表明指标的权重就越大。

熵值法的最大优点在于直接根据原始决策数据所给出的信息来计算评估指标相对重要性权重，避免了因引入决策者的主观判断而导致的权重偏倚。基于此，本文利用熵值法计算差异系数对PLS模型确定的外部权重系数进行修正，具体步骤简述如下：

步骤1，计算评估对象i在评价维度j下的权重值比重 pij：

在此基础上得到各维度数据的归一化矩阵P={pij}。

步骤2，计算维度j所对应的熵值ej：

其中，常数K与被评估的对象数量n有关。由于本文共量化评估40位作者的影响力，故而n=40，K=1/ln(40)=0.2711。

步骤3，计算维度j的差异系数dj。对于第j项评价维度而言，如果该指标的差异系数d越大，则表示该维度的重要性越大，则该维度所对应的熵值就越小。定义差异系数 dj的计算公式如下：

步骤4，确定维度j的指标权重wj，用差异系数dj对PLS模型确定的外部权重pj进行修正：

通过熵值法对PLS模型确定的13个指标权重的修正，计算结果见表5。根据表5可知，修正后的13个指标中，第一作者论文数量对领域作者影响力的权重系数最大，为0.138，紧随其后的是总被引频次，达到0.134；其余依次为总下载量（0.114）、最高下载量（0.088）、最高被引频次（0.087）、核心论文数量（0.072）、合作者数量（0.069）、被引用成果数（0.068）、高被引论文数（0.065）、论文数量（0.064）、g指数（0.037）、篇均被引频次（0.033）、h指数（0.031）。熵值法修正之后，第一作者论文数量、总被引频次和总下载量是对领域作者影响力贡献度最高的3个指标，g指数、篇均被引频次和h指数是权重系数最小的3个指标。

表5 熵值法修正后领域作者综合影响力权重系数wj

2.4 领域作者影响力结果比较分析

本文认为，衡量评价指数或模型的有效性主要体现在以下方面：（1）与以往评价指数或模型相比较，核心作者位次波动应在合理范围内；（2）名次相同的作者占比少，能够有效区分作者的影响力。

2.4.1 比较1：作者名次变化稳定性

根据修正PLS模型确定的13个观测变量对综合影响力的外部权重，笔者计算了40位作者的综合影响力。为详细讨论修正PLS模型确定的领域作者影响力与h指数、g指数的评价异同点，本文分别绘制了40位作者的h指数、g指数和PLS名次图，见图2和图3。可以看出，因为存在部分作者的h指数和g指数数值相同，h指数和g指数均呈现出阶梯状分布，说明仅仅利用h指数和g指数是无法进一步区分数值相同作者的影响力。反之，基于熵值修正的PLS模型可以得到数值完全不相同的学者影响力排名。

此外，本文进一步统计了40位作者的h指数、g指数与PLS模型的排名名次之差（变化1为h指数排名减PLS排名，变化2为g指数排名减PLS排名），正值表示PLS名次排名靠前，负值说明PLS名次排名靠后，见图3。

图2 h指数、g指数排名情况

图3 PLS排名、排名变化情况

从表6可以看出，编号1的作者（邱均平）、编号3的作者（柯平），以及编号9的作者（范并思）从h指数和g指数来看，都在40位作者中排名靠前。三位作者的PLS影响力排名分别位列前3，这说明他们的科研成果影响力较高，得到研究领域内作者的高度认可（文献被引用多），因此属于领域内核心作者。

编号22的作者（朱庆华），虽然其h指数和g指数的排名较为靠后，但PLS影响力排名却位列第8。分析原因可能是：①最高被引频次较高，共被引260次，40位作者中排名第9；②总下载量较多，达到60 976次，40位作者中排名第9；③核心论文数量多，77篇论文中有72篇属于核心论文。这说明本文提出的领域作者影响力评估指标具有一定的有效性，能识别出虽然h指数和g指数较低但影响力较高的作者。

表6 h指数、PLS数值和g指数排名及作者编号（以h指数降序排列）

编号23的作者（李国新），虽然其h指数和g指数排名较为靠前，但其PLS影响力排名却位列第22位，下降幅度非常明显。分析可知，虽然编号23号学者的第一作者论文数量可观，但是其总被引频次、总下载量等指标落后于很多h指数和g指数比其低的作者，因而导致其排名发生明显变化。

此外，本文对40位作者的名次变化情况进行描述性统计分析，以更深入地揭示PLS模型计算的学者影响力名次变化的稳定与波动情况（见表7）。

表7 40位作者名次变化描述性统计结果

根据图3以及表7详细分析可知，40位作者的PLS名次相比于h指数和g指数分别平均微跌0.85位和0.53位，标准差（9.93/9.97）和方差（98.69/99.49）较大，整体数据的变化较为显著。01-10区间作者的排名分别上升5.3、5.9个排名，标准差（7.92/7.43）和方差（62.68/55.21）处于3个分段中的最小值，说明利用修正PLS模型的计算结果领域内核心作者名次变化较为稳定。11-30区间作者的名次分别微跌0.65和上升0.05个名次。与h指数相比，修正PLS模型的作者名次标准差（9.63）和方差（92.77）在三个分段中最大，说明该阶段的名次变化最为突出，最大值和最小值相差38位之多。与g指数相比，修正PLS模型的作者名次标准差（8.76）和方差（76.68）一般。31-40区间作者的名次平均下降7.4位和8.1位，作者名次标准差（8.91/10.18）和方差（79.38/103.66）都较大，说明该阶段的作者名次变化明显，通过h指数和g指数排名靠后的学者名次上升明显，原因可能是修正PLS模型尽可能多地将影响作者学术成就的因素纳入到计算范畴。

2.4.2 比较2：作者影响力区分度分析

h指数和g指数在评估领域作者影响力时，统计发现h指数共有11组31位作者数值相同，占作者总人数的77.50%；g指数共有10组24位作者数值相等，占作者总人数的60.00%。可以发现，仅仅依靠h指数和g指数无法精确区分作者之间的学术影响力。

进一步分析可知，h指数和g指数相同的作者影响力，通过修正PLS模型计算的40位科研人员综合影响力不存在相同的情况：编号3的作者（柯平）和编号23的作者（李国新）两位学者的h指数都为28，而通过熵值修正PLS模型计算出结果并非相同：编号3作者综合影响力为12 213.94，编号23作者仅为4 905.05，原因可能是李国新作者除篇均被引频次上略高于编号3作者之外，其余12个指标全部低于后者，尤其是在总下载量上，二者相差60 000多次。类似的情况还有编号21和编号25等。

编号5的作者（郑建明）和编号28的作者（王子舟）两位学者的g指数都为35，且编号28的作者h指数（h指数为22）要高于编号5的作者（h指数为17），基于熵值法修正PLS模型计算出的综合影响力上，编号5作者要领先于编号28的学者，主要原因是其在论文数量、核心论文数量、总被引频次、最高被引频次、总下载量、最高下载量和被引用成果数指标上领先编号28作者较多。类似的情况还有编号20和编号38、编号27和编号34等。

总体来看，在11组31位作者h指数相同和10组24位作者g指数相同的情况下，修正PLS模型计算出的综合影响力能够百分之百地区分h指数和g指数相同作者的影响力大小，区分效果非常突出。

3 结语

为精准评价科研人员影响力的研究，本文基于熵值法、PLS模型对领域内作者影响力进行综合量化评价。在确定产出指标、传播指标和引文指标三个一级维度，以及h指数、g指数、总被引频次等二级指标基础上，借助smart-PLS软件构建并修正作者影响力评估的度量模型，计算发现总被引频次、总下载量和被引用成果数对作者影响力贡献度最高。随后，利用熵值法计算差异系数对PLS模型确定的外部权重系数进行调整，确定评估指标的最终权重，发现第一作者论文数量、总被引频次和总下载量权重较高。最后，通过对图书情报领域40位作者的实证分析，将熵值修正PLS模型方法计算的领域作者影响力与h指数、g指数从名次变化稳定性和区分性两个角度进行详细比较，分析发现熵值修正PLS模型方法在名次变化较为明显，对h指数和g指数相同的作者区分性达到100%。综上所述，将熵值法、PLS方法综合运用于领域作者影响力计算上具有一定可行性。

然而，本文仍然存在以下几点不足：①由于《情报学报》记录的缺失，导致40位作者的数据记录存在不完整性，实际结果可能存在一定出入。②熵值修正PLS模型仅仅以图书情报领域40位作者为实证对象，样本的研究领域与范围仍需要进一步扩大。③替代计量学方兴未艾，论文的评论、转发与分享数等“社会影响力”指标未曾在评估指标中涉及。