基于改进蜂群算法的项目反应理论混合模型参数估计

2014-01-23 10:45温长吉王生生周翠娟

吉林大学学报（理学版） 2014年4期

关键词：题组参数估计蜂群

温长吉，王生生，赵昕，李健，周翠娟

（1.吉林农业大学信息技术学院，长春 130118；2.吉林大学符号计算与知识工程教育部重点实验室，长春 130012）

基于改进蜂群算法的项目反应理论混合模型参数估计

温长吉1，2，王生生2，赵昕1，李健1，周翠娟1

（1.吉林农业大学信息技术学院，长春 130118；2.吉林大学符号计算与知识工程教育部重点实验室，长春 130012）

基于混合项目反应理论模型，实现了对客观题组和主观测试组成项目结构的模型构建，并给出一种改进人工蜂群算法实现该混合模型的参数估计.在模拟数据上通过与Winbug的对比结果验证了利用改进人工蜂群算法估计混合模型参数的有效性.

项目反应理论；混合模型；参数估计；人工蜂群算法

项目反应理论也称为潜在特质理论或潜在特质模型，是一种现代心理测量理论，可指导项目筛选和测验编制.当前国内计算机考试测评体系及其认知诊断平台普遍存在对考生能力测查不足，且在知识考查过程中所测查知识以考生死记硬背为主，缺乏知识间的联系与组合.针对上述问题，项目反应理论从认知诊断心理学出发，能客观准确地反映学生能力，对学生的知识缺陷作出合理诊断.现代教育测试命题形式多样，一般以主客观两部分命题方式常见，因此建立混合模型对测试属性和被试能力进行科学准确的评价尤为必要.但目前混合模型的构建及其参数估计研究基础较薄弱，文献报道较少.文献［1］首次提出了混合模型的思想，并指出模型构建的可行性；文献［2］在项目参数已知的条件下，通过固定混合模型的权重参数提出一种被试能力估计策略；文献［3］利用加权最大后验估计在混合模型权重自适应变化的基础上实现了被试能力的估计；文献［4］提出了混合3PLM和GRM的项目反应理论模型，并利用EM／MMLE方法实现了混合模型的参数估计.上述研究结果推动了项目反应理论中混合模型的研究，但也存在一定的局限性：一方面混合模型中的参数设定相对固定，不适应多样化的测试命题形式；另一方面采用传统项目理论参数估计方法，由于涉及非线性方程组迭代求解问题，迭代收敛速度慢、参数估计偏差较大、理论性较强等因素，因此在一定程度上限制了项目反应理论在相关领域的推广和应用［5－6］.参数估计问题由于可转化为非线性方程组迭代求解问题，因此利用群智能算法进行参数估计成为可能［7－9］.人工蜂群算法［10］因其参数设置少、收敛速度快、收敛精度高，且每次迭代过程中同时进行全局和局部双向搜索，因此成为群智能算法研究的热点［11－12］.

本文构建了由三参数题组反应理论模型和分步评分模型组成的混合模型用于主客观测试项目的描述，并通过在全局搜索中引入启发式规则，在局部搜索中自适应调整搜索半径，提出一种改进人工蜂群算法用于混合模型的参数估计.与项目反应理论分析软件Minbug对比，模拟数据实验结果验证了本文提出的改进人工蜂群算法用于混合参数估计的有效性.

1 模型方法

1.1 三参数题组反应理论模型

三参数Logistic题组理论模型（three－parameter logistic testlet response model，3PLTRM）［13］用于解决题组内部题目关联性的问题.三参数Logistic题组理论模型表达式为

其中：ai表示试题i的试题区分度系数；bi表示难度系数；ci表示猜测系数；θj表示被试能力系数；γjd（i）表示题组随机效应参数，用以表征被试j与题目i所在题组d（i）间的相互作用参数.

1.2 分步评分模型

分步评分模型（partial credit model，PCM）［14－15］可对主观性试题逐步作答进行描述.分步评分模型表达式为

其中：f j表示试题i的满分值；t表示被试在此题上的分值；bjx表示被试在已经作答x－1步后预完成第x步的难易度；θj表示被试能力系数.

1.3 改进人工蜂群算法

人工蜂群算法的思想是根据生态环境一致性原则［16－17］，最优或较优蜜源附近可能分布大量优质蜜源.首先将当前获取的最佳蜜源与若干轮前获取的最佳蜜源位置信息建立指引路径，从而为引领蜂搜索提供启发式规则，降低搜索随机性，加快算法的收敛速度；其次，自适应调整搜索半径，局部蜜源搜索时，半径增大从而适度扩大跟随蜂和侦查蜂的搜索范围，然后适度减小搜索半径实现局部区域聚焦加速最优蜜源搜索.算法改进策略如下.

1）启发式规则为将当前获取的最佳蜜源与若干轮前获取的最佳蜜源位置信息建立指引路径，作为引领蜂全局搜索的启发式规则：

其中：θi（k）表示第k代引领蜂位置信息；genfix和Maxcycle用以给定向前溯源轮数域值，本文中L＝5.

2）半径自适应调整策略为

其中：rand［－1，＋1］取值为＋1或－1；rand（－1，＋1）随机取［－1，＋1］间的值；f k，f j，flim依次表示邻域搜索范围内第k，j和邻域迭代最大代数对应最优目标函数值.随机步长φij可保证邻域搜索初期步长较大搜索范围相应较大，算法迭代后期伴随目标函数值趋近邻域内最优值，搜索步长逐渐缩小聚焦局部最优区域，加快算法局部搜索寻优的速度.

2 基于改进人工蜂群算法估计混合模型参数

2.1 收益度函数的确定

利用改进人工蜂群算法实现混合模型参数估计，基于文献［5］利用混合模型的似然函数构建收益度函数，混合模型似然函数表达式为

则改进人工蜂群算法的收益度评价函数为

2.2 参数设定

设定蜂群个体数为N＝40，局部区域搜索迭代代数限定lim＝10，全局最大搜索迭代次数为Maxcycle＝2 000.混合模型参数设定依据分步形式选取合适区间，以加速算法收敛.改进人工蜂群算法参数设定列于表1.

表1 混合模型参数取值设定Table 1 Setting of mixture model parameters

2.3 改进人工蜂群算法实现混合模型参数估计

对于项目参数和能力参数均未知的参数估计问题，依据Birnbaum参数估计思想把问题分解为两阶段进行：

1）假设被试能力参数已知，对项目参数进行估计，初始能力参数估计采用被试回答正确得分数和总分比值作为被试初始能力值；

2）将初始估测出的被试能力值作为真值，对项目参数进行估计.

上述两阶段循环进行，直至参数值趋于稳定.

3 模拟实验

模拟数据产生原则依据文献［3］，实验过程中分别对500和200个被试者各自进行总测试项目数为40和30的模拟实验.测试项目模拟设计如下.

1）测试项目数为40的混合模拟数据，4组带有题组结构的二级反应数据：组1有10个题目，组2有10个题目，组3有5个题目，组4有5个题目；10个多级记分题目.

2）测试项目数为30的混合模拟数据，3组带有题组结构的二级反应数据：3组题组类数据，每组各有5个题目；10个多级记分题目.

本文提出的改进蜂群算法，算法中参数及目标函数设定依据上节中的设定原则.为了有效验证算法的有效性，将本文方法与使用MCMC方法的Winbug软件包计算结果进行对比，Winbug软件是一个采用Bayes方法利用MCMC解决复杂统计模型的软件，其使用算法具有普适性，因此本文使用该软件对模型中参数的估测作为对比验证标准.实验重复10次取计算平均值作为最终的实验结果，对比实验结果列于表2.实验过程中参数的反真性指标采用均方根误差（root mean square error，RMSE）进行度量，用以表示参数估计值与真值间的偏差程度，RMSE计算表达式为

其中n和m分别表示题组数目和被试者数目.

表2 差异化项目结构和被试者数目下两种方法的对比实验结果Table 2 Comparative experiment results of the two methods for variable items and tests

由表2可见，本文基于改进人工蜂群算法实现混合模型参数估计方法的估测值与Winbug软件估计结果基本一致，其中（30，200）题组数和被试者数模拟设定实验中，项目参数估计值整体优于Winbug软件估计值；在（30，500）设定中，部分参数估计值也明显优于软件估计值，因此可猜测在小样本量测试实验中本文方法的有效性；此外，在上述模拟实验中本文方法在题组难度系数估测中整体估测结果也优于软件估计结果.

综上所述，以均方根误差作为反真性指标，将本文方法与Winbug软件包在模拟数据上进行比较，实验结果表明，利用改进人工蜂群算法估计混合模型参数具有较高的精度，同时多次重复实验结果不依赖于参数的初始值选取，算法具有较高的稳定性.因此，本文提出的利用改进人工蜂群算法估计项目理论模型参数高效可行.

［1］ Ercikan K，Schwarz R D，Julian M W，et al.Calibration and Scoring of Tests with Multiple Choice and Constructed Response Item Types［J］.Journal of Educational Measurement，1998，35（2）：137－154.

［2］ TAO Jian，SHI Ningzhong，CHANG Huahua.Item－Weighted Likelihood Method for Ability Estimation in Tests Composed of Both Dichotomous and Polytomous Items［J］.Journal of Educational and Behavioral Statistics，2012，37：298－315.

［3］ SUN Shanshan，TAO Jian，CHANG Huahua，et al.Weighted Maximum－a－Posteriori Estimation in Tests Composed of Both Dichotomous and Polytomous Items［J］.Applied Psychological Measurement，2012，36（4）：271－290.

［4］涂冬波，蔡艳，戴海琦，等.项目反应理论新进展：基于3PLM和GRM的混合模型［J］.心理科学，2011，34（5）：1189－1194.（TU Dongbo，CAI Yan，DAI Haiqi，et al.New Progress on IRT：The Mixture Model Based on 3PLM and GRM［J］.Journal of Psychological Science，2011，34（5）：1189－1194.）

［5］施三支，王德辉，宋立新，等.随时间变化系数参数AR模型的Bayes估计［J］.吉林大学学报：理学版，2011，49（5）：857－860.（SHI Sanzhi，WANG Dehui，SONG Lixin，et al.Bayesian Estimation of Time Vary Parameter Autoregression Model［J］.Journal of Jilin University：Science Edition，2011，49（5）：857－860.）

［6］朱复康，李琦.INGARCH（1，1）模型参数的矩估计和Bayes估计［J］.吉林大学学报：理学版，2009，47（5）：899－902.（ZHU Fukang，LI Qi.Moment and Bayesian Estimation of Parameters in the INGARCH（1，1）Model［J］.Journal of Jilin University：Science Edition，2009，47（5）：899－902.）

［7］熊红云，曹新社.运用粒子群优化算法估计IRT参数［J］.福建电脑，2006（10）：175－176.（XIONG Hongyun，CAO Xinshe.Using Particle Swarm Optimization to Estimate IRT Parameter［J］.Fujian Computer，2006（10）：175－176.）

［8］杜鹏东.GA在IRT中2PLM参数估计中的应用研究［D］.呼和浩特：内蒙古师范大学，2007.（DU Pengdong.The Applied Study on Genetic Algorithm in Parameter Estimation of Two Parameters Logistic Model on Item Response Theory［D］.Hohhot：Inner Mongolia Normal University，2007.）

［9］袁洲.基于改进粒子群算法的项目反应理论3PLM参数估计方法研究［D］.长春：吉林大学，2011.（YUAN Zhou.The Research of Item Response Theory 3PLM Parameter Estimation Based on Improved Particle Swarm Optimization［D］.Changchun：Jilin Unversity，2011.）

［10］ Karaboga D，Basturk B.On the Performance of Artificial Bee Colony（ABC）Algorithm［J］.Applied Soft Computing，2008，8（1）：687－697.

［11］温长吉，王生生，于合龙，等.基于改进蜂群算法优化神经网络的玉米病害图像分割［J］.农业工程学报，2013，29（13）：142－149.（WEN Changji，WANG Shengsheng，YU Helong，et al.Image Segmentation Method for Maize Diseases Based on Pulse Coupled Neural Network with Modified Artificial Bee Algorithm［J］.Transactions of the Chinese Society of Agricultural Engineering，2013，29（13）：142－149.）

［12］毕晓君，王艳娇.约束多目标人工蜂群算法［J］.吉林大学学报：工学版，2013，43（2）：397－403.（BI Xiaojun，WANG Yanjiao.Constrained Multi－objective Evolutionary Algorithm Based on Artificial Bee Colony Algorithm［J］.Journal of Jilin University：Engineering and Technology Edition，2013，43（2）：397－403.）

［13］ Bradlow E T，Wainer H，Wang X.A Bayesian Random Effects Model for Testlets［J］.Psychometrika，1999，64（2）：153－168.

［14］杜文久，肖涵敏.多维项目反应理论等级反应模型［J］.心理学报，2012，44（10）：1402－1407.（DU Wenjiu，XIAO Hanmin.Multidimensional Grade Response Model［J］.Acta Psychologica Sinica，2012，44（10）：1402－1407.）

［15］吴锐，丁树良，甘登文.含题组的测验等值［J］.心理学报，2010，42（3）：434－442.（WU Rui，DING Shuliang，GAN Dengwen.Test Equating with Testlets［J］.Acta Psychologica Sinica，2010，42（3）：434－442.）

［16］ Banharnsakun A，Achalakul T，Sirinaovakul B.The Best－So－Far Selection in Artificial Bee Colony Algorithm［J］.Applied Soft Computing，2011，11（2）：2888－2901.

［17］ Karaboga D，Gorkemli B，Ozturk C，et al.A Comprehensive Survey：Artificial Bee Colony（ABC）Algorithm and Application［J］.Artificial Intelligence Review，2014，42（1）：21－57.

Modified ABC Based Parameter Estimation of the Mixture IRT Model

WEN Changji1，2，WANG Shengsheng2，ZHAO Xin1，LI Jian1，ZHOU Cuijuan1
（1.CollegeofInformationandTechnology，JilinAgriculturalUniversity，Changchun130118，China；2.KeyLaboratoryofSymbolicComputingandKnowledgeEngineeringofMinistryofEducation，JilinUniversity，Changchun130012，China）

A mixture IRT model was proposed which is composed of the testlet response model and the partial credit model for representing the subject and object tests.Meanwhile a modified artificial bee colony algorithm was proposed to estimate the parameters in the mixture model.The comparative experiment results based on the simulate data show that the novel method in this work is feasible and effective.

item response theory；mixture model；parameter estimation；artificial bee colony algorithm

TP301.6

1671－5489（2014）04－0758－05

10.13413／j.cnki.jdxblxb.2014.04.24

2013－12－09.

温长吉（1979—），男，汉族，博士研究生，讲师，从事数据挖掘和模式识别的研究，E－mail：chagou2006＠163.com.通信作者：王生生（1974—），男，汉族，博士，教授，博士生导师，从事模式识别和时空推理的研究，E－mail：wss＠jlu.edu.cn.

国家自然科学基金（批准号：61133011；61303132；61103091）、吉林省科技发展计划项目（批准号：20120665；20100181；20140101201JC；201201131）和吉林农业大学科研启动基金（批准号：2012037）.

韩啸）