高校学生恋爱影响因素的累积Logistic回归分析模型

2017-01-11 14:16孙小军介科伟
计算技术与自动化 2016年4期
关键词:回归方程变量高校学生

孙小军 介科伟

摘要:高校学生恋爱对其自身学习与成长有很大的影响,为了帮助大学生树立积极向上的恋爱观。本文通过对我国10所高校500份“高校学生恋爱调查报告”所获数据的Pearson相关性分析,引入恋爱疏远度来表示恋爱双方的感情程度。在分析各单因素对恋爱疏远度影响的基础上,建立综合因素下高校学生恋爱影响因素的累积Logistic回归分析模型,并通过模型确定出影响高校学生恋爱的两个重要因素。

关键词:影响因素;Pearson相关性分析;恋爱疏远度;累积Logistic回归模型

中图分类号:G41文献标识码:A

Abstract:Love among college students has a great influence on their own learning and growth. In order to help them to have a positive attitude towards love, the distance of intimating was introduced to display the degree of affection between two lovers by the Pearson correlation analysis of 500 College Students Love Survey data from 10 universities . Based on the influencing analysis of single factor on the distance of intimating, a cumulative logistic regression analysis model of influencing factors for love in college students was built under the composite factor, and two important factors of influencing college students love were determined by the model.

Key words:influencing factor; Pearson correlation analysis; distance of intimating ;cumulative logistic regression model

1引言

大学生谈恋爱现已是大学的普遍现象,而不再是以往的“犹抱琵琶半遮面”了。随着高校大学生恋爱所引发的一些社会问题的出现,大学生恋爱引起了社会,特别是许多教育工作者及家长的普遍关注,能否让他们树立正确的恋爱观这不仅关系着大学生自身能否健康的成长,而且也关系着学校的精神文明建设能否顺利开展。所以了解大学生思想和心理实际,引导大学生认真对待恋爱,对促进大学生树立健康向上的恋爱观具有十分重要的现实意义。

本文通过对全国4所985、211高校及6所普通高校总计500份《高校学生恋爱调查报告》的数据整理分析,发现当前大学生恋爱中存在着传统道德观念逐渐淡化、恋爱物质元素日趋上升、无所谓的爱情观越来越普遍等主要问题[1-5]。另外,由于高校学生来自全国各地,地域性、家庭背景、异地恋爱的距离和信任度等诸多因素,也都给高校学生恋爱带来诸多考验。下面将通过对所获数据作Pearson相关性分析,在讨论单个因素对恋爱疏远度影响的同时,建立了综合情况下高校学生恋爱影响因素的Logistic回归模型。

2数据和方法

2.1数据来源

文中数据来源于对全国10所高校所做的500份《高校学生恋爱调查报告》。调查对象涉及综合类、理工类、师范类、医学类、艺术类等院校。采用网络问卷形式进行,在对问卷资料进行整理、分析的基础上,利用SPSS19.0统计软件进行数据处理和分析。

2.2数据处理

了解高校学生恋爱的影响因素有助于大学生树立健康向上的恋爱观,对大学生自身的学习、健康成长有很大的促进作用。因此有必要对所调查数据进行深入的统计分析,文中选用Pearson相关性分析[6,7]和累积Logistic回归模型[8]对大学生恋爱的影响因素及其影响程度进行定量分析。为了确定重要的影响因素及其影响程度,首先通过相关性分析进行变量的初步筛选,其次通过回归分析进一步筛选,并对各因素的影响程度进行量化,最后通过回归方程进行定量处理。

2.3统计方法

1)Pearson相关性分析

由于调查问卷的结果为属性数据,不能直接用于数学计算,需先将其量化为数字[9],再对其进行样本相关系数估计。设X=(x1,x2,…,xn),Y=(y1,y2,…,yn)分别来自X和Y的两个样本,则相关系数为

r=∑ni=1(xi-)(yi-)∑ni=1(xi-)2∑ni=1(yi-)2(1)

这里r的绝对值越大表示因变量与自变量的相关程度越高:r<0.3,表示微弱相关、0.3

2)累积Logistic回归模型

为了更进一步的解释和预测变量之间的因果关系,还需建立广义线性模型。由于文中因变量是定型变量,所以在此使用累积Logistic回归模型。

累积Logistic回归模型是广义线性模型的一种,设因变量Y是一个二元响应变量,取0、1两个值,记π=P(Y=1),则累积Logistic回归模型为:

log π1-π=Z′(X)β

当Y取一组有序的值k时,记Y取各值的概率为πi=P(Y=i),i=1,2,…,k,则累积Logistic回归模型:

log P(Y≥j+1)P(Y≤j)=log P(Y≥j+1)1-P(Y≥j+1)

=Z′(X)β…,(j=1,2,…,k-1) (2)

不难看出上述累积Logistic回归模型事实上包含了k-1个模型。

3模型建立及分析

这里引入恋爱疏远度[10]P来表示恋爱双方之间的感情程度。为了更准确地反映恋爱疏远度与各影响因素之间的关系,本文采用累积Logistic回归分析进行研究。

3.1高校学生恋爱影响因素的分析

相关系数r的值可以为影响因素的初步筛选提供依据,r的绝对值越大,则表明恋爱疏远度与影响因素之间的相关程度越高,这时该影响因素可以作为备选的重要因素。这里利用式(1)计算恋爱疏远度与影响因素之间的相关系数。表1中列出了相关系数大于0.4的影响因素。

除了表1中列出的这些影响因素外,恋爱对象的外貌和能力、经济状况和家庭背景也会影响到恋爱疏远度。

由于恋爱疏远度为定型变量,因此本文针对恋爱疏远度及其影响因素之间的关系建立了累积Logistic回归模型,选取表1中相关系数大于0.4的影响因素作为初始自变量,并运用逐步回归方法,筛选出自变量中重要的影响因素。

计算技术与自动化2016年12月

第35卷第4期孙小军等:高校学生恋爱影响因素的累积Logistic回归分析模型

模型中含有某变量表明该变量对模型具有影响。如果某一变量在进入模型后又被剔除,则说明其它变量和该变量的相关程度很大,即该变量可以用其它变量来表示。从表1可以看出,影响因变量(恋爱疏远度)的12个初始自变量可分为个人因素、恋爱双方之间的因素和社会因素。

3.2单影响因素对恋爱疏远度的影响分析

这里选取社会因素为例,根据累积Logistic回归模型的极大似然估计,利用Logistic模型式(2)对社会因素(父母、同伴、媒体)计算,可以确定恋爱疏远度与这三个影响因素之间的函数关系式,并且可以得到此函数的拟合效果和正判概率。

从表2可以看出:在0.05的显著性水平下,社会因素中的同伴是显著的。同时,可以得到恋爱疏远度与社会因素之间的Logistic回归方程:

f1=–42.704+21.501×N6,这里N6表示同伴

因此可建立如下累积Logistic回归模型:

P1=f1/(1+f1)(3)

其中,f1是在计算P1时引入的函数,P1代表社会因素对恋爱疏远度的影响。

从表4中的数据可以看出:恋爱疏远度中“距离近”一类的正判断概率为56.6%,“距离远”一类的正判断概率为100%,总的正判概率为72.6%,这也表明模型(3)的拟合效果较好。

同理分别建立恋爱疏远度与个人因素和恋爱双方之间因素的Logistic回归方程:

f2=–63.609+20.564×N4+21.842×N3

f3=–63.609+20.747×N2+21.608×N1

式中N1表示相互之间的信任、N2表示包容理解、N3表示性格品德修养、N4表示志同道合。因此可建立相应的累积Logistic回归模型:

P2=f2/1+f2P3=f3/1+f3(4)

其中,fi是在计算Pi时引入的函数(i=2,3),P2代表个人因素对恋爱疏远度的影响,P3表示恋爱双方之间因素对恋爱疏远度的影响。

由于恋爱疏远度的影响因素之间存在着一定的相关性,在对12个自变量进行Pearson相关性分析时发现:父母与同伴的相关系数高达0.991,共同理想与尊重双方人格的相关系数为0.928,共同理想与独立承担责任之间的相关系数为0.950,外貌与魅力和成绩与能力之间的相关系数为0.988,因而在建模过程中上述每组的两个因素之一被剔除。

3.3多影响因素对恋爱疏远度的综合影响

根据累积Logistic回归模型的极大似然估计。利用上述同样的计算方法,综合考虑各因素,分析在恋爱过程中的影响程度,得到以下累积Logistic回归方程:

f=–63.609+21.608×N1+20.797×N2

因此这里建立的高校学生恋爱因素分析累积Logistic回归模型为:

P=f/1+f(5)

其中,f是在计算P时引入的函数,P为多影响因素与恋爱疏远度的综合累积Logistic回归模型。

通过对上述影响因素的整体分析,可以看出在众多的影响因素中,相互之间的信任、包容理解是影响高校学生恋爱的两个最重要的因素。

4结论

从高校学生恋爱的态度出发,研究高校学生恋爱的影响因素具有重要的现实意义。本文以《高校学生恋爱调查报告》的统计数据为依据,经过Pearson相关性分析,得到影响恋爱的因素涉及:父母、同伴、媒体(新闻、网络、书籍等)、恋爱双方之间的包容理解、相互之间的信任、尊重双方的人格平等、共同理想的追求、自觉承担责任、恋爱对象的性格品德修养、志同道合、成绩和能力、外貌和魅力、经济状况和家庭背景。通过累积Logistic回归模型的极大似然估计,建立了综合因素下高校学生恋爱回归模型,并由该模型得出高校学生恋爱的两个最重要的影响因素。

参考文献

[1]米兰.高职院校学生恋爱教育研究[D].长沙:湖南大学,2013,4.

[2]颜玫琳.高校大学生恋爱现象和恋爱观教育研究[D].南昌:南昌大学,2012,6.

[3]卜望飞.思想政治教育视域下的大学生恋爱观教育研究[D].重庆工商大学,2014,6.

[4]汪冬华.多元统计分析与SPSS应用[M].上海:华东理工大学出版社,2010,9.

[5]何晓群.多元统计分析(3版)[M].北京:中国人民大学出版社,2012,1.

[6]汪冬华. 多元统计分析与SPSS应用[M].上海:华东理工大学出版社,2010.

[7]何晓群. 多元统计分析(3版)[M].北京:中国人民大学出版社,2012.

[8]李俊秀. 应用Logistic回归分析(2版)[M].上海:格致出版社,2012.

[9]吴明隆. SPSS操作与应用—问卷统计分析实务[M].重庆:重庆大学学出版社,2010.

[10]周星,克居正. 男生追女生的数学模型[J].数学的实践与认识,2012,42(12):1-8.

猜你喜欢
回归方程变量高校学生
应用型本科高校学生“学习百年党史”学习满意度与行为意向研究
教育部开通高校学生资助热线
采用直线回归方程预测桑瘿蚊防治适期
浅谈回归方程在煤质检验中应用时应注意问题
严惩诱骗高校学生参与传销的组织者
基于三元交互理论的高校学生创业风险控制策略研究
分离变量法:常见的通性通法
5统计案例(回归分析及独立性检验)
不可忽视变量的离散与连续
轻松把握变量之间的关系