标准差、标准误差和估计标准误差辨析

2018-08-13 10:55刘忠广河南工程学院工商管理学院
消费导刊 2018年11期
关键词:标准差总体体重

刘忠广 河南工程学院工商管理学院

标准差、标准误差是统计学的重要概念。标准差是根据原始数据计算的,反映一组原始数据的离散程度。而标准误差是根据样本统计量计算的,反映统计量的离散程度。标准差与标准误差的区别还在于求标准差仅需要一个样本的数据,但是求标准误差需要多个样本的数据。而在实际应用中,往往是根据一个样本的数据来计算标准误差的,这时计算的标准误差就是估计标准误差。这几个概念比较抽象,理解起来比较困难。同时,不同的教材对标准误差也有多种叫法,如标准误[1]、抽样平均误差[2][3]、抽样标准差[4]等等。另外,在统计学教学内容的线性回归部分,不同教材对残差均方的平方根的叫法也有不同,如估计标准误差[5][6]、预测标准误差[7]、回归估计的标准误差[8]等,这些都给统计初学者带来了困惑和不解。

一、标准差

标准差的英文单词是standard deviation, standard是典型或平均的意思,deviation的含义是离差,指一个分布中的一个取值与该分布的平均取值之差。所以标准差是一个分布单个取值与均值之间的典型或平均离差[9]。具体计算时各变量值与其算术平均数(也称均值)离差平方的平均数称为方差,方差的平方根即为标准差。标准差反映了每个变量值与其均值相比平均相差的数值,能准确地反映出数据的离散程度,标准差是应用最广泛的反映数据离散程度的测度值。标准差的计算为:

如果获取的是总体的数据,反映总体数据离散程度的可用总体标准差,其计算公式为:

σ=,µ为总体均值,N为总体数据的个数

一般来说,我们获取的数据大多是样本数据,反映样本数据离散程度的为样本标准差,其计算公式为:

s=为样本均值,n为样本容量(下同)

二、标准误差和估计标准误差

标准误差(Standard Error)是某一统计量(如样本均值、样本均值之差、样本比例、相关系数等)抽样分布的标准差。标准误差用于衡量样本统计量的离散程度,在参数估计和假设检验中,它是用于衡量样本统计量与总体参数之间差距的重要尺度。在实际应用中,标准误差往往是根据样本数据计算来的,根据样本数据计算的标准误差实际上是估计标准误差(在用统计软件计算时给出的都是估计标准误差)。常见的标准误差有样本均值的标准误差、样本比例的标准误差、样本相关系数的标准误差、线性回归方程斜率及截距的标准误差、回归估计的标准误差等。

三、举例说明

【例】从某一高校的女生中随机抽取10名学生,测其身高和体重数据见表1.

表1:某高校10名女生身高和体重数据

(一)用Excel的数据分析工具对这10名女生身高和体重进行描述统计,结果见表2.

表2:某高校10名女生身高和体重的描述统计

从表2可以看出这10名女生的平均身高为161.7cm,平均体重为61.1kg.表中标准差是身高和体重的样本标准差.标准误差分别是身高和体重的估计标准误差,是根据估计标准误差的公式计算出来的,即:

可以估计全校女生的平均身高和平均体重95%的置信区间分别为:

(二)利用Excel数据分析工具对该校女生身高与体重进行相关与回归分析,结果如表3、表4、表5.

表3 :某高校女生身体和体重的回归统计

从表3可以得到相关系数为0.87,可以计算相关系数的标准误差

5.12 > 2.306 ,所以拒绝原假设,结论是该校女生身高和体重相关关系显著.

表中的标准误差为回归估计的标准误差,其意义为,根据身高来预测体重时,平均的预测误差为3.91kg.

表4:某高校女生身高和体重的方差分析表

根据表4方差分析表,由于P=0.00 < 0.05,所以,身高与体重的线性关系显著.

表5:某高校女生身高和体重的回归分析表

四、结语

标准差、标准误差和估计标准误差这三个概念字面相似,但代表的含义有不同,标准差是根据原始观测数据计算出来的,计算标准差仅需要一个样本数据。标准误差是根据统计量抽样分布计算出来的,从理论上讲计算标准误差需要所有可能样本的数据,但在实际应用中,是根据一个样本的数据来计算标准误差的,这时的标准误差即为估计标准误差。

猜你喜欢
标准差总体体重
给鲸测体重,总共分几步
用样本估计总体复习点拨
用Pro-Kin Line平衡反馈训练仪对早期帕金森病患者进行治疗对其动态平衡功能的影响
2020年秋粮收购总体进度快于上年
称体重
外汇市场运行有望延续总体平稳发展趋势
你的体重超标吗
直击高考中的用样本估计总体
我为体重烦
对于平均差与标准差的数学关系和应用价值比较研究