基于数据挖掘探究城镇居民的主观幸福感影响因素

2019-08-15 01:02曹程泽
消费导刊 2019年15期
关键词:随机森林主观幸福感城镇居民

曹程泽

摘要:人民幸福感的提升是社会发展与进步的一个重要方面,因此不断提升国民的幸福感尤为重要。本文基于2015年度中国综合社会调查的相关数据,利用决策树和随机森林的模型,对城镇居民的主观幸福感影响因素进行预测,并分析影响城镇居民主观幸福感的因素,发现随机森林模型的预测结果更好。研究分析表明,公共服务满意度对城镇居民主观幸福感的影响最大;全年家庭总收入,平均空闲时间,政府工作满意度以及心情抑郁或沮丧的频繁程度对城镇居民主观幸福感的影响也较为显著。因此国家应该努力发展经济,提高人均收入水平,应该坚持为人民服务的工作原则,以人为本,从而提高城镇居民主观幸福感。

关键词:城镇居民 主观幸福感 决策树 随机森林 Python

一、引言

新中国建立后,在中国共产党的领导下,经过全体人民的共同努力及奋斗,中国取得了举世瞩目的成绩,我国社会主要矛盾已经转化为人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾。2016年,习近平总书记在全民国家安全教育日上强调,要不断提高人民群众的安全感和幸福感。可见,幸福感作为反映民生的指标,在理论研究和实践中都值得关注。随着中国城镇化不断提升,城镇居民以及居住在城镇的居民比例逐步提升,其主观幸福感对全体社会的稳定、和谐发展起着至关重要的作用。城镇居民的主观幸福感的影响因素的研究对于宏观政策的制定、实施,不断提升国民的幸福感具有非常重要、积极的社会意义。

主观幸福感是个体对目前生活总体质量进行积极评价的程度,即个体对自己生活的喜欢程度。自Easterlin提出“收入一幸福悖论”以来,个体主观幸福感的影响因素及幸福感提升问题引起了众多经济学家的兴趣。不同国家与地区的学者针对某一集合范围内的幸福感进行了大量的研究,由于发展阶段不同,某一区域贫富分布不同,居民的文化背景、宗教影响的巨大差异,同样一个重要因素,比如收入对幸福感的影响,不同的研究对象群体,得出的结论往往是相互矛盾的。Biswas-Diener和Diener研究发现,印度加尔各答贫民窟居民的主观幸福感通常要比富裕的对照群体强。Binder和Coad发现,英国居民家庭的绝对收入对其主观幸福感具有显著的正向提升作用,但对幸福程度较高居民的影响则不显著。国内针对幸福感的研究从绝度收入、相对收入以及收入结构逐步发展到关注家庭收入,养老收入对个体幸福感的研究。万佳乐和李超伟等人认为中国居民的幸福感不仅存在着显著的相对收入效应与绝对收入结构效应,而且具有显著的城乡异质性,两种效应存在着显著不同。从绝对收入结构效应来讲,起关键作用的是经营性收入、转移性收入和财产性收入,三种收入的增加,可以显著提升居民家庭的幸福感。闰静,彭代彦等人认为家庭养老显著降低了中国居民的幸福感,且这种负面影响随家庭人均收入的增加而减弱,家庭养老对中年群体的负面影响最大。

主观幸福感常常与多种复杂因素有关,中国正处于城镇化剧烈碰撞过程中,二十年来改革开放物质生活的快速提升与文化生活的固有规律之间的不平衡:南北东西区域发展的不均衡:社会阶层形成初步固化趋势,中国居民的传统家国天下文化与实用文化之间的不平衡;网络文化的迅速扩张等等因素,都对居民的个体幸福感有着重要的影响,因此不能只用经济收入和生活质量衡量。本文通过调查数据,全面考虑多种因素,通過建立决策树模型和随机森林模型等数学模型的方法对预测城镇居民主管幸福感进行预测,然后寻找影响主观幸福感的因子,从而为国家提高人民的幸福感提出更好的建议。

二、模型介绍

(一)决策树模型

决策树是一种基本的分类方法,该方法通常包含三个步骤:特征选择、决策树的生成和决策树的剪枝。决策树的算法的本质是递归选择最优特征,并根据该特征进行分割。这一过程对应着决策树的构建,也对应着特征空间的划分,使得划分之后的各个子集能够被基本分类,那么构建叶节点;否则继续递归划分。其具体步骤为:

第一,确定根节点,求出对应的熵,从而得到信息熵,计算信息增益或信息增益率,从而确定根节点;信息熵的具体公式为:

第二,重复第一步计算信息增益的计算公式,递归算法构造出决策树;

第三,决策树构造完成后,进行剪枝,然后评价决策树的好坏。

(二)随机森林模型

随机森林的核心思想是就是由多棵决策树构成的集成模型。对于任意一棵树,该树的训练集是从总的训练集中有放回随机采样得到的。训练过程可以总结如下:

第一,给定训练集s,测试集T,确定所需要的树的个数t和每棵树的深度d。

第二,从s中有放回的抽取训练集,训练集的个数t,从根节点开始训练。

第三,根据回归树的思想构建决策树,对每棵树进行评价。

第四,所以决策树都被训练过,根据少数服从多数的思想进行投票分类。

三、数据获取

本文分析数据选取中国综合社会调查(CGSS)2015年度调查得到的城镇居民的样本(http://cgss ruc edu cn/),样本为2391个。通过从多方面多角度对影响城镇居民主观幸福感因素的分析,在社区内进行调查,以及从网上查阅资料,本文选取了以下指标作为参考因素:性别、最高教育程度、身体健康状况、心情抑郁或沮丧的频繁程度、户口登记状况、空闲时间、生活是否幸福、社会保障项目、全年家庭总收入、家庭经济状况在所在地属于哪一档、几处房产、社会经济地位、关于社会公平的讨论、政府工作满意度以及公共服务满意度等指标,统计结果如表1。

性别不仅仅是生理划分,其也是社会发展过程中非常重要的角色定义。男性和女性对于幸福感的判断具有相当大的主观差异,是幸福感衡量的一个重要因子。身体健康,心理健康是居民幸福感衡量的基础因素。全年家庭总收入、家庭经济状况在所在地属于哪一档、几处房产、社会经济地位等因素都是居民幸福感的重要的经济基础因素以及由此而带来的社会认知因素。关于社会公平的讨论、政府工作满意度以及公共服务满意度等指标是居民对社会生活满意度的反映,随着我国人民物质生活水平的不断提升,居民参政议政的意愿也逐步增强,这也符合马斯洛的需求层次理论。休闲时间在某种程度上是个体之所以为个体的一个表现。户口登记情况则关系到居民的社区归属感以及在当前情况下同居民子女的教育强相关,同样是其主观幸福感的重要因素。而居民不同的教育程度对上述物质的、精神方面以及社会责任实现等方面的权重,有着显而易见的影响。

猜你喜欢
随机森林主观幸福感城镇居民
城镇居民住房分布对收入不平等的影响
天津城镇居民增收再上新台阶
随机森林在棉蚜虫害等级预测中的应用
基于二次随机森林的不平衡数据分类算法
拱坝变形监测预报的随机森林模型及应用
民办高校大学生主观幸福感与心理控制源相关研究
档案工作者主观幸福感的影响因素及提升策略研究
西藏高校大学生自我概念与主观幸福感的特点
基于随机森林算法的飞机发动机故障诊断方法的研究
滇辽两省城镇居民体育锻炼行为的比较研究