大学生参与公益活动的影响因素研究

2024-01-24 10:58彭玉蛟王宏平马雪静蒋剑军
电脑知识与技术 2023年34期
关键词:公益事业公益活动志愿

彭玉蛟 王宏平 马雪静 蒋剑军

摘要:大学生作为有知识有文化有理想的青年一代,参与公益事业并推动公益事业发展是不可回避的社会责任。如何更好地培养大学生的公益意识,为公益事业的发展培养更多的青年力量,也成为近年来公益事业思考的重要议题。文章通过调查问卷获得大学生参与公益活动现状的数据,引入机器学习方法量化分析大学生对公益认知和参与情况的影响因素。首先利用斯皮尔曼相关系数分析大学生参与公益活动积极性与其他因素之间的相关性;然后引入有序多分类logistic回归模型挖掘大学生参与公益活动积极性的显著影响因素;最后应用随机森林和lightGBM模型对显著影响因素进行重要性评估,得到显著性影响因素的重要性排序。由量化分析结果得出结论:“公益广告大赛-我是公益人”活动是大学生了解公益事业的最重要渠道,腾讯公司发起并资助的“乐捐、月捐、一起捐”是大学生最常参与的公益活动,参与公益活动最大的收益是获得证书。

关键词:大学生公益活动;影响因素分析;有序多分类logistic回归模型;随机森林;LightGBM模型

中图分类号:TP311      文献标识码:A

文章编号:1009-3044(2023)34-0119-04

开放科学(资源服务)标识码(OSID)

0 引言

国家的全面发展激活了国民的公益意识[1]。大学生作为有知识有文化有理想的青年一代,了解并参与公益事业进而推动公益事业的发展是不可回避的社会责任[2-4]。关于大学生公益活动参与现状研究是近年来的热点,结出了丰硕的成果。比如,王赵基于对江苏省10所高校的实证调查对大学生微公益活动参与的现状、影响因素进行了研究,并提出来大学生参与公益事业的引导对策[5];高雪平、杨淑涵则基于浙江高校的调查提出了大学生互联网公益参与度的提升路径[6];张润姣、阳慧玲对大学生公益的“互联网+微公益”模式进行了调查研究,并提出对策鼓励在校大学生更多地开展线上公益行为[7];马越以西北政法大学为例对大学生网络公益活动参与状况进行了细致的思考[8]。在丰富的成果中,关于大学生参与公益活动影响因素的研究,特别是研究中引入量化方法,并不多见,而且大学生对于公益的认知与参与度有待进一步细致的了解,并进行實证分析。本文通过设计并发布《关于大学生公益认知及参与情况的调查问卷》获得大学生对公益的认知及参与情况的第一手资料,再应用机器学习方法量化分析大学生参与公益的影响因素的显著性,并评估显著性因素的重要程度,分析结果对推动大学生公益事业发展有现实意义。

1 关于大学生公益认知及参与情况的调查

本文自主设计了《关于大学生公益认知及参与情况的调查问卷》,共有包括“性别”“年级”“学科”等共20个问题,其中单选问题9个,多选问题11个。调查问卷编制完成后发布在腾讯问卷平台上,历时15天收回有效问卷 378 份。调查问卷及采集到的数据已保存在百度网盘,链接:https://pan.baidu.com/s/1jOsw3 H8KZOvunFi1snhkLw?pwd=kj4x,提取码:kj4x。

2 数据预处理

本文的目的是对大学生公益认知及参与情况的影响因素进行研究,所以本文以问卷中问题10“您参与公益活动的频率”为响应变量,记为[Y],其他各问为影响因素。

调查问卷中所有题项对应的因素都是定性的,数据预处理的主要任务是对定性变量进行赋值。响应变量[Y]有五个取值:经常、一般、偶尔、几乎不、没有。在研究[Y]与其他因素的相关性时对[Y]进行独立编码;在研究[Y]与其他因素的因果关系时对[Y]赋值如下:

[Y=1, 当Y=“经常”2, 当Y=“一般”3, 当Y=“偶尔”4, 当Y=“几乎不”5, 当Y=“没有”]

影响因素中,单选题对应的变量按独热编码赋值,对多选题对应的变量则按多热编码赋值。赋值完成后,影响因素从原来的18个变为116个(各问题下的各选项都成为了变量),记为[X1,X2,…,X116]。预处理后的数据已保存在百度网盘,链接:https://pan.baidu.com/s/1hvqUmtBzennykn4t15_aXQ?pwd=w9e3,提取码:w9e3。

3 大学生公益活动认知及参与情况影响因素分析

本小节研究路线如图1所示。

3.1 “大学生参与公益活动的频率”与其他因素的相关性分析

本文引入斯皮尔曼相关系数研究影响因素的各选项对响应变量[Y]的各选项的相关性,挖掘参与公益的频率分别为“经常”“一般”“偶尔”“几乎不”“没有”相关性强的因素。计算部分结果见表 2。

表 2罗列的是对响应变量[Y]的各选项“经常”“一般”“偶尔”“几乎不”“没有”正相关前三和负相关前三的因素。从相关系数看,有下述结论:

1) “[X32]=所在的学校有关于公益活动的社团吗?_有,活动较多,经常宣传鼓励大家参与”与大学生“经常”参与公益活动是正相关的,也是影响大学生“几乎不”参与公益活动的首要因素;而“[X31]=所在的学校有关于公益活动的社团吗?_有,但活动较少”是影响大学生“经常”参与公益活动的首要因素。

2) “[X35]=是否参与过公益_参与过”既与“一般”也与“偶尔”正相关,还与大学生“没有”参与过公益活动强负相关(相关系数为[-1]) 。

3) “[X36]=是否参与过公益_B.没有”与大学生“没有”参与公益活动强正相关(相关系数为[1]) ,也是影响大学生“一般”或“偶尔”参与公益活动的首要因素。

4) “[X74]=对什么类型最感兴趣及原因:二级标题_联通社交功能,偷取能量”是导致大学生“几乎不”参与公益活动的首要因素。

上述结论都与常识相符。

3.2 “参与公益的频率”与其他因素因果关系分析

3.2.1 有序多分类logistic回归模型

有序多分类logistic回归模型是典型的多元统计分析方法,广泛应用于因变量为有序变量的因果推断[9]。在大学生参与公益活动影响因素分析中,易知响应变量[Y]是有序变量,即其取值“经常、一般、偶尔、几乎不、没有”呈现出一种递减的趋势。所以,本文引入有序多分类logistic回归模型来研究[Y]与[X1,X2,...,X116]的因果关系,挖掘对[Y]有显著影响的因素。本文[Y]关于[X1,X2,...,X116]的有序多分类logistic回归模型的表达式如下:

[lnp(Y≤j/X1,…,X116)1-p(Y≤j/X1,…,X116)=μj-β0+i=1116βiXi] (1)

[pY≤j/X1,…,X116=μj-β0+i=1116βiXi1+eμj-β0+i=1116βiXi] (2)

式[1]和式[2]中,[β0]为截距项,[βi]为模型的偏回归系数,表示[Xi]对[Y]影响的方向和程度;[μj]为分界点。

3.2.2 SPSS实现

由SPSS输出的参数估计结果显示,在5%的显著性水平下,有11个变量对因变量影响显著,而其余105个变量对因变量的影响并不显著。筛选出的显著性变量如表 3所示。

其中11个显著性变量的含义如表4所示。

从表3各变量的回归系数看,正向影响因素有8个:[X25,X29,X32,X37,X45,X48,X49,X99],负向影响因素有3个:[X10,X83,X88]。

3.3 “参与公益活动频率”显著影响因素的重要性

表3列出了对“大学生参与公益活动的频率”有显著影响的因素。这些因素对[Y]的影响程度是不同的,因此需要对它们的影响力进行量化,并据此对它们按影响力排序。变量的影响力也称为变量的重要性,本文引入两种机器学习方法——随机森林及LightGBM,来挖掘变量的重要性。

3.3.1 随机森林

随机森林是一种集成学习方法,因其预测精度高、数据兼容性强而应用广泛。随机森林既可用于回归[10]也能用于分类,还能评估因素的重要性。随机森林对变量重要性的评估是通过基尼系数的平均变化量或袋外误差率的平均变化量来实现的。本文应用随机森林以袋外误差率的平均变化量来评估表3中11个显著性变量的重要性,结果见表 5随机森林所在列。

3.3.2 LightGBM模型

LightGBM(轻梯度提升机器)模型是一种基于GBDT的集成学习方法,广泛应用于回归[11]或分类。LightGBM使用回归树作为弱学习器,以每个预测结果与目标值的残差作为下一个学习目标,每棵树都学习所有先前树的结论与残差,将多棵决策树的结果加在一起作为最终预测输出,是一种高效率、高精度、高性能的分类算法。

由于LightGBM算法使用梯度提升决策树作为基学习器,所以可记录每个特征在树节点中出现的次数,一个特征出现的次数越多说明对分类做出的贡献越大,即特征的重要性定义为该特征在所有树中作为划分属性的次数。本文应用lightGBM提取的显著性变量的重要性见表 5中lightGBM列。

变量的重要性可视化如图2(图中lightGBM评估的重要性做了除以1000运算)。

从表4或图2可以看出,两种方法评估的变量的重要性基本一致,重要性的大小说明11个显著性变量对大学生参与公益活动的影响力是有明显差异的。

4 结论

通过对大学生认知和参与公益活动的影响因素分析,本文获得如下结论。

4.1 基于影响因素的显著性

应用有序多分类logistic回归模型,从116个变量提取了11个显著性变量。从这11个显著性变量的回归系数看,对大学生参与公益活动的频率有正向影响的因素共8个,负向影响的因素共3个。

8 个正向影响因素为学校组织公益活动是建立激励机制提供了方向,比如“您参与公益活动有哪些收益:获得证书”([X99]) ,则在制定奖励方案时,“证书”是必要的激励项。

3 个负向影响因素分别是,“大一”([X10]) 、“志愿工作任务繁重,志愿时间长”([X83]) 、“H.其他”([X88]) 。“大一”负向影响了大学生对公益的参与程度,说明大一学生尚在逐步熟悉大学生活的过程中,对公益活动的认知尚未建立起来;“志愿工作任务繁重,志愿时间长”影响了大学生参与公益活动的热情,符合常理;影响大学生参与公益活动的“H.其他”选项,则道出了大学生对公益事业真实而又难以言表的心情。

4.2 基于显著性变量的重要性

从显著性变量的重要性看来,对大学生参与公益活动影响前三的因素是[X25,X29,X99],都是正向影响因素,表明“公益广告大赛-我是公益人”([X25]) 活动是大学生了解公益事业的最重要渠道,腾讯公司发起并资助的“乐捐、月捐、一起捐”([X29]) 是大学生最常参与的公益活动,参与公益活动最大的收益是获得证书([X99]) 。

在负向影响因素中最重要的是“志愿工作任务繁重,志愿时间长”([X83]) ,这提醒学校志愿活动组织者,在组织志愿活动时在志愿任务和志愿时间上要有综合考虑,否则可能会让志愿活动效果适得其反。

参考文献:

[1] 王宇深.高校共青团服务大学生微公益意识培育的路径探索[J]. 智庫时代,2018(46): 94-95.

[2] 陈彦同, 秦崇胜.如何通过组织大学生公益活动引导大学生思想政治教育:论公益活动对大学生思想政治教育的如何有效开展[J]. 明日风尚,2018(6) : 222,251.

[3] 尹玉力.大学生公益活动的思想政治教育功能研究[D].太原:太原理工大学,2017.

[4] 贺雪娇.大学生公益活动参与现状研究[D].昆明:云南大学,2017.

[5] 王赵.大学生微公益活动参与的现状、影响因素及引导对策:基于对江苏省10所高校的实证调查[J].无锡商业职业技术学院学报,2022,22(1):82-88.

[6] 高雪平,杨淑涵. 大学生互联网公益参与度提升路径研究:基于浙江高校调查[J].湖北开放职业学院学报,2021,34(3):50-52.

[7] 张润姣,阳慧玲.“互联网+微公益”视域下在校大学生公益状况调查[J]. 高教学刊,2019,116(20):187-189,193.

[8] 马越.大学生网络公益活动参与状况考量:以西北政法大学为例[J].文化创新比较研究,2018,2(19):57-58.

[9] 石峰,胡燕.高校毕业生创业意愿的影响因素分析:基于有序多分类Logistic回归模型[J].生产力研究,2021,343(2):131-135,161.

[10] 刘亚琴,刘瑞卿,颜中玉.基于粗糙集和随机森林算法的数学师范生就业预测研究[J].湖南师范大学自然科学学报,2023,46(1):136-142.

[11] 欧阳群文. 基于LightGBM的水质预测模型研究与应用[J].智能城市,2022,8(11):84-87.

【通联编辑:李雅琪】

猜你喜欢
公益事业公益活动志愿
高考志愿被篡改,考生该何去何从?
公益活动证书
我志愿……
公益事业与趣味活动并举,小黄狗以公益驱动环保
手拉手,献爱心公益活动
“温暖寒冬”公益活动行(三)
爱让我们在一起——献给社会公益事业的志愿者们
公益事业单位人事改革研究
如何防止高考志愿再遭篡改
因爱汇聚,志愿同行