运用Matlab和SPSS软件求解回归分析的比较研究

2016-09-14 09:57肖郑利
山西青年 2016年18期
关键词:置信区间回归系数对话框

肖郑利

天津机电职业技术学院,天津 300350



运用Matlab和SPSS软件求解回归分析的比较研究

肖郑利

天津机电职业技术学院,天津300350

在研究变量之间的相关关系时要用到回归分析。本文以一个给定的线性回归模型,分别介绍Matlab软件和SPSS软件求解过程,两者的计算结果是一样的。分析过程可知:Matlab的优势是函数丰富、编程灵活;SPSS的优点在于界面友好、操作简单。均为回归分析提供了全面的解决方案

线性回归;Matlab;SPSS;统计量

回归分析是研究变量之间相关关系的数学方法,是将实际问题中体现的相关关系转化为确定性关系来解决的过程。常见的实际问题有:生活中近似关系的表达,通过观测数据对固定数值的预测和控制,根据测量数据对生产工艺进行优化等等。回归分析按照自变量的数量可以分为一元回归和多元回归;按照方程形式可以分为线性回归和非线性回归。随着计算机技术的应用发展,有多种软件可以求解回归方程并进行分析,常用的有数学软件Mathematica、科学计算软件Matlab、数据统计分析软件SPSS和表格应用软件excel等等。

本文以简单的一元线性回归为例,分别利用Matlab软件和SPSS软件求解分析,并进行比较研究。

首先给出一个实际案例。

考察温度x对产量y的影响,测得下列10组数据

温度(℃)20253035404550556065产量(kg)13.215.116.417.117.918.719.621.222.524.3

分析y关于x的线性回归方程,检验回归效果是否显著。

一、Matlab软件求解回归分析

(一)Matlab软件介绍

Matlab软件有总包和若干个工具箱,可以进行数值分析、统计、优化,可以完成信号处理、图像处理等领域的计算和图形显示。它用函数形式将各类数学分支的算法分类,使用时可设计参数再选择调用相应的函数,快速而准确的解决问题。

(二)Matlab软件中回归分析命令介绍

线性回归的命令是regress,用以确定回归系数的点估计值:b=regress(Y,X);求回归系数的点估计和区间估计,并进行检验,直接用命令:[b,bint,r,rint,stats]=regress(Y,X,alpha),其中alpha是显著性水平 ,缺省时默认为0.05,bint是区间估计,r是残差,rint计算残差的置信区间,stats记录检验回归模型的统计量,有四个数值分别是相关系数R 、F检验值、与F对应的概率P以及方差的估计值;还可以画残差计算其置信区间,命令为:rcoplot(r,rint)。这里面R 越接近1,则回归方程越显著;F值越大,也说明回归方程越显著;P小于 时,回归模型成立。

(三)Matlab软件求解上述案例

1.输入数据:

x=20:5:65;

X=[ones(10,1) x'] ;

Y=[13.2 15.1 16.4 17.1 17.9 18.7 19.6 21.2 22.5 24.3]';

2.回归分析及检验:

[b,bint,r,rint,stats]=regress(Y,X);

b,bint,stats

计算结果为:

b=

9.1212

0.2230

bint=

8.021110.2214

0.19850.2476

stats=

0.9821439.83110.00000.2333

即回归模型为 成立。

3.残差分析并作图:

rcoplot(r,rint)

得到图1。

z=b(1)+b(2)*x

plot(x,Y,'k+',x,z,'r')

得到图2。

二、SPSS软件求解回归分析

(一)SPSS软件简介

SPSS软件是社会科学统计软件,具有先进成熟、操作简便的统计方法。它强大的统计分析过程,可以实现基本统计分析方法、多元统计方法和专业统计分析等功能。

(二)线性回归的SPSS操作

线性回归分析在SPSS Statistics数据编辑器窗口的具体操作有以下几个步骤:首先是打开“线性回归”对话框;然后在对话框中选择变量;再进行相应的设置,逐一选取需要用到的统计量和图形方式等内容;最后单击“确定”,在SPSS Statistics查看器窗口得到线性回归分析结果。

(三)SPSS软件求解上述案例

第一步:从“文件”菜单中选择“打开”、“数据”点击,将事先保存在wps文件中的数据调用出来;

第二步:选择“分析”菜单中的“回归”、“线性”命令,打开“线性回归”对话框,将“温度”选入“自变量”,“产量”选入“因变量”;

第三步:单击“统计量”按钮,在“线性回归:统计量”对话框中选中“估计”、“置信区间”,然后单击“继续”;

第四步:单击“绘制”按钮,在“线性回归:图”对话框中选中“直方图”、“正态概率图”,然后单击“继续”;

第五步:回到“线性回归”对话框,单击“确定”按钮,完成操作。

于是在查看器窗口得到一系列输出结果,选取其中案例需要的数据列出如表1-表2,同时得到图3和图4:

模型汇总b

表1

表2

三、比较分析

从上述两种软件求解结果来看,我们发现不管是使用Matlab还是SPSS,计算的回归系数、系数的区间估计、统计量中的相关系数、F值、与F对应的概率、方差的估计值等等都是一样的。而求解过程两者差别很大:Matlab是在视窗环境中编写程序,进行数据分析、建模仿真,函数资源丰富,灵活性较强;SPSS是菜单操作,图形交互式的友好界面操作简单,强大的数据分析处理功能针对性较强。总之两种软件各有其优势,均为回归分析提供了全面的解决方案。

[1]赵静,但琦.数学建模与数学实验[M].高等教育出版社,2008.

[2]Cleve Moler.MATLAB数值计算[M].机械工业出版社,2006.

[3]陈胜可.SPSS统计分析从入门到精通[M].清华大学出版社,2013.

[4]张文彤,钟云飞.IBM SPSS数据分析与挖掘实战案例精粹[M].清华大学出版社,2013.

O212.1

A

1006-0049-(2016)18-0058-02

猜你喜欢
置信区间回归系数对话框
Maxwell分布参数的最短置信区间研究
p-范分布中参数的置信区间
多个偏正态总体共同位置参数的Bootstrap置信区间
正常恢复虚拟机
Bootlace Worms’Secret etc.
What Is Beauty?
列车定位中置信区间的确定方法
多元线性回归的估值漂移及其判定方法
电导法协同Logistic方程进行6种苹果砧木抗寒性的比较
电导法协同Logistic方程进行6种苹果砧木抗寒性的比较