共线性

  • 考虑多重共线性影响的中国财政收入实证研究
    关系,也称多重共线性问题,即模型解释变量中存在线性关系而使得模型难以估计或失真。广大学者对此提出了许多解决方法,比如主成分回归分析法、差分法、逐步回归法、岭回归法、偏最小二乘估计法等,以期更为准确地估计模型。财政收入预测是财政部门编制预算的基础,甚至会影响政府作出合理准确财政决策。因此,本文细致描述多种解决多元回归模型中多重共线性问题的估计方法,科学分析财政收入影响因素,对未来的财政收入进行预测并提高系数估计精度具有现实意义。2 文献综述2.1 财政收入影

    中国商论 2023年21期2023-11-15

  • 板蓝与葡萄、漾濞槭基因组的共线性分析
    ense)进行共线性分析和全基因组比对分析,旨在厘清板蓝基因组的进化历程,探究板蓝的生物学功能。1 材料与方法1.1 植物基因组数据从不同的网站下载了每个基因组项目的基因组序列和注释文件。葡萄的基因组数据可以在NCBI 上找到(https://www.ncbi.nlm.nih.gov/),漾濞槭的基因组信息可以在GenBank 找到(http://www.ncbi.nlm.nih.gov/genbank/),板蓝的基因组数据可以在CNGB Sequence

    南方农业 2023年15期2023-11-04

  • 板蓝与葡萄、漾濞槭基因组的共线性分析
    关键词 板蓝;共线性;多倍化;全基因组比对;同义核苷酸替换率中图分类号:S567.23+9 文献标志码:A DOI:10.19415/j.cnki.1673-890x.2023.15.003板蓝(Strobilanthes cusia)是爵床科灌木状多年生草本植物,广泛分布在我国的四川、贵州、浙江和福建等地。板蓝全身皆可入药,根被称为“南板蓝根”,茎和叶经加工后可得青黛,能够治疗病毒性肝炎、流感、感冒、肺炎、炎症、疱疹、丹毒、蛇咬伤等[1],青黛是牛黄消

    南方农业·上旬 2023年8期2023-11-03

  • 基于岭回归的河西走廊中部日光温室低温预测模型
    变量存在的多重共线性对模型稳定性的影响。多重共线性使参数的最小二乘方差很大,各回归系数的符号可能出现错误的现象,其系数对样本数据的微小变化可能变得敏感[4]。处理共线性的方法常有主成分回归、岭回归、神经网络模拟法等,李宁等[5]应用主成分回归分析的方法,建立了日光温室内最低温度预报模型;金志凤等[6]构建了BP 神经网络模型,进行了杨梅大棚内气温预测。关于岭回归分析模型在日光温室低温预测中的应用目前还未见报道,岭回归是一种专用于共线性数据分析的有偏估计回归

    农学学报 2023年5期2023-08-01

  • 植物SUS基因家族的系统进化及其在玉米中的干旱诱导表达分析
    系统进化及基因共线性分析使用MAFFT对鉴定出的SUS蛋白质序列进行多序列比对[23]。以来自胶球藻(Coccomyxasubellipsoidea)的SUS蛋白作外类群[24],使用FastTree构建系统发育树。使用DIAMOND进行物种间和种内的基因组序列比对,MCScanX对共线性区域进行检测[25],Rstudio对结果进行调取,Gephi将共线性结果可视化。1.3 SUS蛋白的理化性质和亚细胞定位预测使用ExPASy Compute pI/Mw

    干旱地区农业研究 2023年3期2023-05-27

  • 一种基于单形空间缺失数据的补全方法
    换后存在的多重共线性数据的填补方法,并结合主成分分析法提出了一种较为有效的参考解决路径。1 单形空间的代数体系为了实现单形空间到欧氏空间的正交变换,本文给出单形空间对于向量的加法、数乘、内积以及距离的如下定义。(1)向量的加法:对于任意X,Y∈SD,向量X,Y的加法运算⊕定义为式中,A[.]为封闭运算,即(2)向量的数乘:对于任意X∈SD,任意实数a∈R,a与向量X的数乘运算⊗定义为(3)向量的内积:对于任意X,Y∈SD,向量X,Y的内积定义为(4)向量的

    现代计算机 2022年19期2022-12-08

  • 基于Ks分布的被子植物演化的时间尺度研究
    或者基因组间的共线性同源基因(Jiao et al., 2011)。对共线性同源基因的分析,是揭示古代的多倍化或物种分歧事件并推定其发生时间和规模的重要途径。多倍化发生后植物基因组通常会变得很不稳定,进化速率也变得显著不同。由于减少了选择性约束,因此这些重复基因通常以更快的速度进化(Wang et al., 2016)。例如,在葫芦科植物基因组的研究中发现,甜瓜的进化速度最慢,西瓜和黄瓜的进化速度分别快23.6%和27.4%(Wang et al., 20

    广西植物 2022年10期2022-11-16

  • 白蜡虫脂酰辅酶A 还原酶基因家族鉴定及序列分析*
    far 基因的共线性Circos 分析使用Mauve 2.3.0 软件对白蜡虫far基因进行共线性分析,参数和视图使用默认值。得到far基因的共线性区域,连接共线性较好的far基因;利用Circos 对共线性结果进行可视化。1.5 系统进化树的构建利用ClustalX 软件对白蜡虫far基因氨基酸序列进行多序列比对,然后将得到的结果导入MEGA 6.0 软件,使用邻接法(Bootstrap=1 000)构建系统进化树[18];使用ClustalX 软件对不

    云南农业大学学报(自然科学) 2022年5期2022-09-22

  • 小麦BES1基因家族的比较基因组学分析
    育、基因结构和共线性关系等方面进行了全基因组比较分析,同时进一步探讨了小麦BES1基因家族成员在小麦不同组织(器官)的表达模式,以期为进一步探索BES1基因家族成员的功能及其进化情况奠定基础。1 材料与方法1.1 BES1基因家族的鉴定从植物参考基因组数据库Ensembl Plants(http://plants.ensembl.org/)下载小麦、大麦、水稻、玉米、高粱、谷子(6种常见的禾本科作物)以及拟南芥(十字花科模式植物)的基因组数据,包括基因组序

    麦类作物学报 2021年10期2021-12-08

  • 基于多元线性回归模型的湖南省粮食产量的影响因素分析
    及显著性检验、共线性诊断等数据,由此得到的模型为:表2 湖南省粮食产量逐步回归结果y^=6523.35+0.598x2-9.027x3表中第二个模型的t检验所对用的P值均小于0.05,这说明有限灌溉面积和化肥施用量对湖南省每公顷面积粮食产量有显著影响。有限灌溉面积的标准化系数Beta相比化肥施用量的标准化系数Beta更大,说明有限灌溉面积较化肥施用量来说,其对湖南省每公顷面积粮食产量影响更大。对回归模型共线性的诊断:虽然自变量对因变量的影响显著,但自变量之

    黑龙江粮食 2021年7期2021-08-11

  • 南瓜SWEET蛋白家族的全基因组鉴定与进化分析
    、启动子预测、共线性预测和基因复制等进行综合分析。结果表明:共鉴定到21个CmSWEET 基因,通过系统发育分析将21个CmSWEET基因分为4个亚族(I,II,III和IV),分别包含3、5、10和3個基因。此外,通过基因结构、跨膜结构域和保守基序发现CmSWEET在进化过程中是非常保守的。染色体定位结果显示,CmSWEET基因不均匀地分布在21条中国南瓜染色体中的13条染色体上,且在染色体Cm00、Cm01、Cm03、Cm05、Cm07、Cm09、Cm

    广西植物 2021年1期2021-03-24

  • 银行不良贷款额影响因素分析
    差,自相关性,共线性问题,通过加权最小二乘模型、迭代法消除这些问题。从而得出社会消费品零售总额对降低不良贷款余额贡献度最大,影响效果最好;股票价格指数对降低不良贷款额有反向抵制作用,且股票价格指数对其抵制作用最大。关键词:不良贷款;异方差;自相关;共线性;加权最小二乘;迭代法;岭回归一、引言银行的不良贷款影响着银行的盈利能力和核心竞争力,同时也影响银行业安全和宏观经济稳定发展。研究我国不良贷款的形成途径和影响因素对于防范不良贷款有重要意义。金融危机的发生很

    科学与财富 2021年3期2021-03-08

  • 岭回归在消除多重共线性中的应用
    要通过消除多重共线性,实现数学模型的精准估计。多重共线性也可称作多重相关性,指自变量之间存在线性相关现象,当自变量之间存在完全线性关系时,则自变量之间的相关性绝对值为1;当自变量之间完全没有线性关系时,自变量之间的相关性为0。上述说明的是2种极端的自变量线性相关关系,通常来说,目前极易出现的是线性程度不同的相关现象,自变量之间的相关性绝对值在0到1之间变化。针对回归分析的多重共线性问题,文献[1]提出岭回归中基于广义交叉核实法的最优模型平均估计方法,在存在

    辽东学院学报(自然科学版) 2020年4期2020-11-24

  • 基于主成分回归分析的颜色与物质浓度辨识研究
    关数据进行多重共线性诊断,得到了变量间存在显著的复共线性,构建主成分回归分析模型,得到较于一般最小二乘法回归方程更小误差的主成分回归方程,并给出了模型的误差分析.1 颜色读数与物质浓度辨识分析经过对5组数据进行处理发现,颜色读数在不同的水溶液浓度下具有一定的相关关系.初步判断组胺、溴酸钾、工业碱、硫酸铝钾的溶液浓度都随着颜色读数变化而变化,而奶中尿素浓度随颜色读数的变化波动性比较大.从数据中可以得到颜色读数在不同的水溶液浓度下具有一定的相关线性关系.在进行

    商丘师范学院学报 2020年9期2020-07-13

  • 基于主成分分析法的赤足迹预测身高模型
    模型会出现多重共线性问题,多重共线性可能会导致分析结果出现一些不合理的情况。本文选用主成分分析法和多元回归结合的方式通过赤足迹建立预测身高模型。1 研究变量与分析1.1 变量选取研究对象是中国刑警学院在校学生和干训学员,实验对象没有足部疾病,在相同的实验环境下采用油墨捺印的方式让实验对象自然行走。共采集100 人的赤足迹。结合当前已有的研究成果[1-4],以左足迹为例选取8 个变量进行主成分分析。分别是跖内缘到跟平行线(X1)、足长(X2)、跖宽(X3)、

    科技传播 2020年8期2020-05-21

  • 银行不良贷款额影响因素分析
    差,自相关性,共线性问题,通过加权最小二乘模型、迭代法消除这些问题。从而得出社会消费品零售总额对降低不良贷款余额贡献度最大,影响效果最好;股票价格指数对降低不良贷款额有反向抵制作用,且股票价格指数对其抵制作用最大。关键词:不良贷款;异方差;自相关;共线性;加权最小二乘;迭代法;岭回归一、引言银行的不良贷款影响着银行的盈利能力和核心竞争力,同时也影响银行业安全和宏观经济稳定发展。研究我国不良贷款的形成途径和影响因素对于防范不良贷款有重要意义。金融危机的发生很

    科学与财富 2020年33期2020-03-10

  • 基于岭回归的山东省城镇化对碳排放的影响分析
    与求解1.多重共线性诊断由于在构建多元线性模型时,选取的自变量之间完全不相关的概率非常低。这种相关关系被称为数据之间的共线性问题,共线性问题会导致回归参数不稳定,增加或减少一个样本点,回归系数的估计值会发生巨大变化。因此,需对自变量之间的关系进行判断。下面借助SPSS软件,通过比较方差扩大因子法得到的VIF值的大小来判断所选数据是否有多重共线性,诊断结果如表1所示。表1 多重共线性诊断由表1多重共线性诊断可知,总人口P的VIF值为113.645,在区间内,

    时代经贸 2020年1期2020-02-27

  • 基于岭回归的工资预测模型
    设成为解决多重共线性问题的关键。通用解会丢失变量提供的有用信息,降低模型的解释度,从而影响模型的应用价值。不同岭回归方法,该方法是给保持无偏的,有用的信息模型变量的估计,具有较小的平均平方误差获得的模型参数,从而稳定模型参数以改善模型的解释这个问题的能力。岭回归是解决数据共线性这种病态特征的有效方法,是最小二乘法的改进,估计的参数能真正反映自变量与因变量之间的客观联系,在一些领域获得了成功应用。二、工资预测的岭回归模型(一)变量的抽象过程随着我国综合实力日

    新营销 2019年8期2019-12-24

  • 关于多重共线性的三个知识点的准确表述
    各列之间的多重共线性越强,的方差越大.称为的方差扩大因子,记为VIFi.本文在文[2]给出的下述(不完全)多重共线性定义基础上讨论.定义1 当存在一个解释变量(不妨设为X1)与其它解释变量X2,…,Xk的样本复相关系数R1·大于0小于1 时,就称样本X(或设计矩阵X的列向量)存在(不完全)多重共线性,或称设计矩阵X的第2列与其它各列之间存在(不完全)多重共线性;当R1·=1时,就称样本X(或设计矩阵X的列向量)存在完全多重共线性,或称设计矩阵X的第2列与其

    温州大学学报(自然科学版) 2019年3期2019-10-14

  • 发育生物学奠基人:刘易斯
    调控基因之间的共线性关系,为发育生物学研究奠定了坚实基础,因此荣膺1995年诺贝尔生理学或医学奖。生命从一个受精卵最终形成完整个体的过程称为发育。这个过程既至关重要,又高度复杂,因此它的精细调控,无疑成为众多生命科学家试图破解的难题之一。1970年代末,多位果蝇遗传学家鉴定了发育调控的一系列关键基因,从而为发育生物学研究打开一扇崭新的大门,美国科学家刘易斯(Edward Butts Lewis)为此做出了奠基性贡献。钟情果蝇1918年5月20日,刘易斯出生

    科学 2019年2期2019-09-10

  • 运用SPSS软件对试验数据回归建模开发高强高导热压铸铝合金材料
    .VIF(多重共线性检验值)反映自变量之间存在某种函数关系.此时无法做到固定其他条件单独考查一个自变量的作用,所观察的这个自变量效应总是混杂了其他自变量的作用,使得对自变量效应的分析不准确而造成分析误差,所以在分析铝合金材料成分之间有没有存在明显的交互作用,需要进行多重共线性的判断和排除多重共线性的影响.VIF值越大,显示共线性越严重.一般判断:当VIF表1 试验基础数据2.2 运行选项的设定根据所需分析的主要参数,在运行SPSS中设定了以下相应的选项:每

    材料研究与应用 2019年2期2019-07-25

  • 文氏图在计量统计类课程教学中的应用 ——以多重共线性内容为例
    量间不存在多重共线性,但在实际研究中,模型中的解释变量间往往存在不同程度的共线性问题,对此情形需要进行相应的消除解决,再行应用OLS。多重共线性的内容在“统计学”“计量经济学”课程中都有涉及,也是教学中的一个重点和难点。在教学实践中,一般采用定义数学方程、矩阵等讲授,但涉及数学知识点多,理论讲解相对费时,如果学生数学基础不扎实,那么对这部分的内容理解起来就相对吃力。通过引入文氏图,可有助于这部分内容讲解和学生的理解。文氏图属于集合论数学分支,用于展示不同集

    长沙航空职业技术学院学报 2019年2期2019-07-13

  • 基于颜色读数与二氧化硫物质浓度回归模型研究
    。3.2 多重共线性判断判断多重共线性方法有多种,本文选用基于方差膨胀因子的多重共线性方法[9-11]。模型为自变量xi关于其它自变量的多元线性回归,计算模型的判定系数,定义第i个自变量的方差膨胀因子:当自变量xi与其它自变量线性相关显著,接近于1,VIFi接近于无穷大,反之,接近于0,VIFi接近于1。VIFi越大说明线性相关越显著,即存在共线性。VIF<5,为共线性较弱;5 ≤VIF≤10,为中等程度共线性;VIF>10,为共线性严重,必须设法消除共线

    中国建材科技 2019年2期2019-07-01

  • 不完全多重共线性定义存在的问题及其修正建议
    2 不完全多重共线性定义存在的问题文[1]指出了目前广泛应用的计量经济学教材[2-8]中不完全多重共线性定义存在的问题,但仅就解释变量为随机变量的情况给了一个新的定义.本文试图进一步分析不完全多重共线性概念的内涵与外延,给出合理定义.下面分析广泛使用的计量经济学教材和应用回归分析教材中给出的三种定义存在的问题.2.1 计量经济学教材中存在的问题1其中vi为随机变量(X0表示所有样本都取1的解释变量).使(4)式成立.使(4)式成立.所以,如上定义不完全多重

    温州大学学报(自然科学版) 2019年2期2019-06-04

  • 巷道复合顶板变形失稳的控制因素分析
    分分析和基于复共线性诊断的线性回归分析;最后,得出复合顶板变形失稳影响因素的敏感系数,进而确定主要影响因素。1 正交试验1.1 正交设计通过阅读大量的文献筛选出对复合顶板变形失稳影响相对显著的6种因素[1-9]:顶板岩性特征、巷道断面尺寸、原岩应力、各分层的厚度、软弱夹层的位置和软弱夹层的厚度。将6个影响因素划分为5个水平,正交表选用L25(56),试验指标为顶板的最大下沉量。将复合顶板的岩性设置为砂岩和泥岩两种岩性组合,复合顶板的分层数目设置为4层。由于

    中国地质灾害与防治学报 2019年2期2019-06-01

  • 岭回归和核主成分回归在消除共线性中的实证分析及比较
    常常会遇到多重共线性的问题.当自变量之间存在严重的多重共线性时,使用最小二乘法得到的回归模型的有效性就会大大降低,模型稳定性也会变得很差,同时给回归系数的统计检验及回归系数的物理含义解释等造成一定的困难.因此采取适当方法消除多重共线性带来的不良影响,对回归模型有着重大意义.国内外学者对消除多重共线性问题得出了许多有效的解决方法,如逐步回归、岭回归、主成分回归、偏最小二乘回归、核主成分回归等.肖雪梦[1]、张应应实例比较了逐步回归、主成分回归及偏最小二乘回归

    数学理论与应用 2019年1期2019-05-04

  • 多元线性回归中多重共线性的研究
    性回归中的多重共线性研究,对三种解决方法进行深入探讨,针对每种解决方法的优劣以及实际应用效果进行深入分析,探讨每种解决方法的实际应用情景,从而提高多元线性回归的统计分析有效性以及预测准确性。三种方法的适用对象以及使用机理,本文研究的中心,其目的是为了提高实际问题中多元线性回归的分析效果,降低多重共线性对分析结果及预测结果的影响,明确这些解决方法的实用情景以及模型预测分析是多元线性回归应用继续解决的问题。一、多元线性回归中多重共线性的研究意义多重共线性问题是

    产业与科技论坛 2019年3期2019-03-22

  • 我国寿险需求影响因素的岭回归分析
    求;影响因素;共线性;岭回归中图分类号:D9文献标识码:Adoi:10.19311/j.cnki.1672-3198.2019.05.0561引言自1979年中国恢复保险业务以来,我国的保险业发展迅速。人寿保险作为一项关乎民生的保险业务,亦是保险业的重要组成部分,自1982年中国人民保险公司恢复人寿保险业务以来,取得了突飞猛进的发展。我国的寿险保费收入在1990年仅有50.08亿,至2016年收入已达22234.6亿元,仅27年的时间就增长了300多倍,特

    现代商贸工业 2019年5期2019-02-18

  • 基于飞行参数的飞机结构载荷最优回归模型
    参数之间的多重共线性较弱,这样才能保证回归模型具有很好的鲁棒性和预测精度。首先需综合飞行参数的物理意义、典型机动类型、载荷类型等,对输入参数进行初步筛选,详见表1(表中:Ny和Nz分别为重心侧向和法向过载)。接着,采用某种技术途径筛选出最优参数组合,详见下文。图1 基于飞行参数的飞机结构载荷识别流程Fig.1 Structural load identification procedure based on flight data表1 输入飞行参数初步筛选

    航空学报 2018年11期2018-11-30

  • 基于比较基因组学分析的方法定位及注释双峰驼MHC基因
    ds进行基因组共线性分析,利用lastz建立起的Pseudo chromosome与HLA、BoLA全基因组序列的线性关系判断筛选出的scaffolds是否准确;然后通过分析MHC基因在两物种间的线性关系,在双峰驼参考基因组中提取出MHC基因序列,并对这些序列进行基因注释;最后根据得到的双峰驼MHC基因绘制系统进化树,研究其基因间的进化关系。【结果】通过对HLA、BoLA基因编码序列与双峰驼转录本用blastn进行序列比对,识别出了相似度较高的3条scaf

    中国农业科学 2018年18期2018-10-11

  • 基于校园大数据的助学金获取关键因素分析* ——以某高校一卡通数据为例
    化后,进行多重共线性分析。2.多重共线性分析Hanushek和Jackson认为Logistic回归模型的参数易受解释变量间共线性的影响[11],由于本文是多因素分析,为了防止各变量存在多重共线性,避免各个变量之间的相互影响,保证结果的准确性,首先对解释变量与被解释变量进行多重共线性检验。[12]本文选取方差膨胀因子(VIF)和条件索引(CI)来检验变量间的共线性[13],一般认为VIF值越大则变量共线性越强,VIF≥5时存在复共线性,VIF≥10时存在严

    中国教育信息化 2018年17期2018-10-08

  • 提高多重线性回归分析实践技能的实证分析
    变量之间无多重共线性。使用多重线性回归分析的常见问题是不重视审查多重线性回归分析的前提条件,从而导致许多问题,甚至会导致错误的分析结果和结论。如可以导致专业上认为非常重要的自变量无统计学意义而不能进入方程;偏回归系数估计值大小或符号与专业知识不符;自变量对因变量作用的实际意义难以解释,有悖常识而产生悖论。3 多重线性回归分析的高级技能分析为了便于评价上述逐步法的结果,给出强制法全模型的结果。取检验水准的默认值α入=0.05、α出=0.10。强制法模型检验有

    卫生职业教育 2018年16期2018-09-05

  • 岭回归分析在解决经济数据共线性问题中的应用
    据常会出现多重共线性问题[1]。多重共线性不是模型设定的错误,但使用传统的最小二乘法(OLS,Ordinary Least Squares)处理这类经济数据时,往往会出现回归系数计算不稳定、模型解释性较差、预测准确性较低等问题[2]。目前,岭回归(Ridge Regression)是处理严重共线性常用方法[2]。Hoerl于1962年最早提出岭回归,这是一种改进的最小二乘估计法,到1970年,Hoerl&Kennard对该方法进行了更详细的讨论[3]。一、

    经济研究导刊 2018年22期2018-08-24

  • 杨树和柳树基因组共线性的可视化分析
    进化机制。基因共线性是指在具有同源性关系的2个物种中,其基因组中有共同的连锁基因,且同源基因的相对顺序具有较高保守性的现象[8]。在生物进化中,基因组会在全基因组复制、染色体重组、染色体倒位和易位等过程中发生结构和数量的变化[9-10]。因此,基因组的共线性分析在非编码序列的确认[11]、新测序物种的注释[12]和全基因组复制事件的估计[8]等过程中具有重要作用。本研究使用 MCScanX[13]、VGSC[14]这2个软件分别进行共线性分析和作图,对杨树

    江苏农业科学 2018年8期2018-05-18

  • 无油樟与葡萄、拟南芥、水稻基因组的多倍化及共线性分析
    基因组间的同源共线性分析,明确多倍化过程对重复基因造成的影响,解析基因组在进化过程中发生的变化,对于探寻单、双子叶植物的共同起源以及研究被子植物的进化过程具有重要的意义。1 材料与方法1.1 全基因组序列数据葡萄(Vitis vinifera,简称 Vv)的全基因组序列来自Phytozome(https://phytozome.jgi.doe.gov),无油樟(Amborella trichopoda,简称 Ar)、拟南芥(Arabidopsis thal

    江苏农业科学 2018年8期2018-05-18

  • 提高三元肥效模型建模成功率的主成分回归技术研究*
    存在严重的多重共线性,制约了OLS法回归建模的有效性。为此,本研究利用福建省近年来 “3414”试验设计方案完成的早稻氮磷钾田间肥效试验结果,探讨三元二次多项式肥效模型多重共线性诊断方法,以及主成分回归(PCR)技术与其在消除多重共线性危害上的应用效果,旨在为提高氮磷钾田间肥效试验的建模成功率提供一种新方法。1 材料与方法1.1 早稻氮磷钾“3414”田间肥效试验资料的收集整理近年来,福建省在水稻测土配方施肥工作中,在福州市、宁德市、南平市、三明市、龙岩市

    土壤学报 2018年2期2018-04-13

  • 大坝监测数据多重共线性问题处理方法的比较研究
    坝监测数据多重共线性问题处理方法的比较研究丁立*,钱强强,赵俊,吴建晔(湖州市测绘院,浙江 湖州 313000)多重共线性是大坝安全监测中一种常见的病态数据问题,为了削弱其对参数估计的影响,本文综合应用了主成分回归法、偏最小二乘回归法、岭回归法和Lasso法等四种有偏估计方法对大坝实测数据进行建模分析,并与多元线性回归模型结果进行比较。结果表明,多重共线性对模型的拟合及预报效果影响不大,但在模型的可解释性以及模型系数的稳定性方面,有偏估计方法更具优越性,且

    城市勘测 2017年6期2018-01-04

  • 多元线性回归的S P SS统计应用 ——以某公司成年男子体脂率与身体形态指标为例
    度(M)”和“共线性诊断(L)”,其余使用默认选项。回到“线性回归”对话框,按“确认”按钮,进行S P SS运算。单击“统计量(S)…”按钮,打开“线性回归:统计量”对话框,如图2所示。在“回归系数”框中选择“估计(E)”项,在“残差”框中选择“Dur b in-W atson”项,在其他选项中选择“模型拟合度(M)”和“共线性诊断(L)”,其余使用默认选项。回到“线性回归”对话框,按“确认”按钮,进行S P SS运算。表1 某公司40名成年男子形态指标汇

    文体用品与科技 2017年16期2017-08-31

  • 我国税收收入影响因素的实证分析
    型统计检验多重共线性检验。在初步建立模型之后,对模型进行统计检验。通过表1可以看出,模型的F值为10069.37,非常大,对应的P值为0.000,显然小于0.01,所有模型整体是显著的。R方和调整之后的R方也接近于1,基本上呈现完全拟合的状态。所以,模型中的自变量很可能存在多重共线性。多重共线性处理。选择TAX=c(1)+c(2)*CZ+e为最初的回归模型,拟合优度为0.992。下面使用逐步回归:第一步:引入FC变量,发现CZ变量的T统计量没用通过检验,放

    环球市场信息导报 2017年5期2017-06-15

  • 我国税收收入影响因素的实证分析 ——以1998~2015年的数据为例
    型统计检验多重共线性检验。在初步建立模型之后,对模型进行统计检验。通过表1可以看出,模型的F值为10069.37,非常大,对应的P值为0.000,显然小于0.01,所有模型整体是显著的。R方和调整之后的R方也接近于1,基本上呈现完全拟合的状态。所以,模型中的自变量很可能存在多重共线性。多重共线性处理。选择TAX =C(1) +C(2)*CZ+e为最初的回归模型,拟合优度为0.992。下面使用逐步回归:第一步:引入FC变量,发现CZ变量的T统计量没用通过检验

    环球市场信息导报 2017年9期2017-06-05

  • 关于我国私人汽车保有量影响因素的计量经济学分析
    计量模型;多重共线性检验;异方差检验;自相关检验本文通过计量模型来分析除了汽车价格外,其他因素如公路里程、全国汽车产量、居民可支配收入、财政收入等多个变量对私人汽车保有量的影响。一、私家车拥有量的多因素分析设定模型为:lny=c+m2lnx2+m3lnx3+m4lnx4+m5lnx5+m6lnx6+ai式中,ai为随机误差项。运用最小二乘法估计模型参数表1 5个自变量回归方程得到回归方程如下式:lny=-2.663+1.011lnx2+0.159lnx3-

    福建质量管理 2016年11期2016-08-16

  • 职业病防治绩效影响因素分析
    最小二乘回归 共线性 主成分1.泰山医学院公共卫生学院(271016)2.济南市儿童医院3.山东大学公共卫生学院职业病防治工作是一项极其复杂的系统工程,其绩效的优劣并不单纯取决于政府相关部门及用人单位努力程度,而是受到政治、经济、文化、社会、科技以及自然等环境因素的影响。本研究在筛选出这些有代表性影响因素的基础上,进一步确定这些因素与职业病防治绩效的定量关系,从而为职业病防治绩效的改善提供依据。对象与方法1.研究对象采用分层随机抽样的方式,按照工业化水平的

    中国卫生统计 2016年2期2016-06-24

  • 岭回归分析及其应用
    行了推广.多重共线性;回归系数;岭回归岭回归分析是一种专门用于共线性数据分析的有偏估计方法,它实际上是一种改良的最小二乘法,是以放弃最小二乘的无偏性,放弃部分精确度为代价来寻求效果稍差但更符合实际的回归过程[1~3].虽然岭回归所得残差平方和比最小二乘回归要大,但它对病态数据的耐受性就远远强于最小二乘法.岭回归方法也非常灵活,它的使用存在着一定的主观人为性,但这种人为性正好是发挥定性分析与定量分析有机结合之处,在解决多重共线性问题中有着独特作用.1 岭回归

    许昌学院学报 2016年2期2016-04-14

  • 焦面拼接反射镜热稳定性对MTF的影响
    定性对探测器的共线性和共面性有一定的影响,共线性和共面性误差会引起时间延迟积分电荷耦合器件(TDICCD)的光学调制传递函数(MTF)的下降。文章首先在三维欧式空间建立拼接反射镜热变形前后的平面方程,通过计算TDICCD顶点关于反射镜平面方程的镜像点得出反射镜热变形对TDICCD共线性和共面性的影响;其次,为了对热稳定性进行有效评价,以MTF为其评价函数,分别对TDICCD的共线性误差、共面性误差对TDICCD相机MTF的影响进行了分析,给出了两种误差引起

    航天返回与遥感 2016年3期2016-02-15

  • 基于广义线性模型的主成分估计及实例分析
    变量之间存在复共线性时,如果仍然按照原来的参数估计方法进行建模的话,就会带来很大的误差.为了解决这个问题,消除复共线性带来的影响才使得得出的参数估计更为稳定,更符合实际情况的需要,本文将主成分估计应用到广义线性模型中去,并分析其在参数估计较最大似然估计的优越性.定义1.1[1]设因变量Y和自变量X1,X2,…,Xp的观测值,若(i)Y1,Y2,…,Yn相互独立,且对每个i,Yi服从指数分布,即(ii)设ui为对应的Yi的数学期望值(i=1,2,…,n),存

    哈尔滨师范大学自然科学学报 2015年5期2015-09-09

  • 相依误差线性模型中的主成分s-K估计
    回归变量间的复共线性,通过融合主成分回归估计和s-K估计,提出一类新估计,称为主成分s-K估计;并在均方误差阵意义下,得到了这类估计分别优于广义最小二乘估计、主成分估计、r-k和s-K估计的充要条件.Monto Carlo数值模拟表明,新估计是一种同时克服自相关性和复共线性的有效方法.自相关性;复共线性;主成分回归估计;s-K估计;均方误差阵为了克服统计学中线性模型的复共线性问题,常用的方法是使用有偏估计.如Stein估计[1]、主成分回归(PCR)估计[

    吉林大学学报(理学版) 2015年3期2015-08-16

  • 多重共线性的有偏回归方法的实例比较
    之间存在着多重共线性。在出现多重共线性情形时,普通最小二乘估计不再适用;回归参数的估计值方差会很大,从而影响自变量对因变量的解释;估计的精度会降低;估计的效果也会变坏。在实际经济问题的多元回归分析中,多重共线性的现象很多,这时我们就应该寻找另外的回归方法对参数进行估计。2 方法介绍目前,处理多重共线性问题的三种有偏回归方法主要是:主成分回归(PCR)、岭回归(RR)和偏最小二乘回归(PLS)。主成分回归是通过对解释变量先进行主成分分析,综合提取出自变量的少

    科技视界 2014年21期2014-12-23

  • 线性模型参数一类新的s-K估计
    但当模型出现复共线性时,LSE的表现较差,有较大的均方误差.为了克服这一缺点,研究者们放弃了无偏性,提出了一些有偏估计.如Hoerl等[1]提出了岭估计(RE):其中k>0是可选参数,称为岭参数.岭估计的本质是在设计阵的计算中引入一个偏参数k,通过合理取k值减少由复共线性带来的误差.之后,Hoerl等[2]又提出了岭估计的一种推广形式,称为广义岭估计(GRE):其中:K=diag(k1,k2,…,kp),ki>0(i=1,2,…,p)为参数;Q=(φ1,φ

    吉林大学学报(理学版) 2014年1期2014-10-25

  • 主成分回归对脑卒中发病与环境因素间关系的解析
    个自变量之间的共线性使得用多元线性回归方法得到的回归方程的精度降低.运用主成分回归分析,对脑卒中发病人数与环境因素进行了深入解析,结合统计软件SPSS的分析结果,给出了计算主成分的正确表达式,并将主成分与发病人数进行多元线性回归,最终确定了脑卒中发病人数与8个环境因素间的数学模型.脑卒中发病;环境因素;主成分分析;数学模型0 引言2012年全国大学生数学建模竞赛C题为脑卒中发病环境因素分析及干预.作为指导教师,一直关注此赛题的研究进展及结果,发现绝大多数参

    淮阴师范学院学报(自然科学版) 2014年3期2014-06-12

  • 基于偏最小二乘回归的城镇登记失业率预测*
    ,无视这种多重共线性,会影响分析的客观性,使结果产生严重偏差。偏 最 小 二 乘 回 归[9~10](Partial Least-Squares Regression,PLSR)是一种新型的多元统计分析方法,集多元线性回归、典型相关分析和主成分分析的功能为一体,能有效解决自变量因子间的多重共线性影响的问题,因此,本文拟对PLSR建模方法在城镇失业率预测中的应用加以探讨,以提高模型拟合效果和预测精度。2 城镇登记失业率影响因素与多重共线性诊断2.1 城镇登记

    舰船电子工程 2013年12期2013-11-28

  • 股票价格线性回归分析——基于matlab 岭回归分析
    间可能存在严重共线性,需要对其共线性进行分析。其次,对自变量进行标准化处理。令z(i,j)=(x(I,j)-μj)/∑( x ( i , j )-μj)2, μj为自变量的样本均值。得到的z 矩阵,为标准化的自变量。对z 进行线性回归Y(i,1)=bb(1,1)+ bb(2,1)* z(i,1)+bb(3,1)*z(i,2)+bb(4,1)*z(i,3),得到回归方程为Y(i,1)=3.7256-2.9928* z(i,1)+ 4.506* z(i,2)+

    时代金融 2013年1期2013-08-07

  • 多重共线性的解决:剔除变量的新标准
    回归模型的多重共线性的本质是解释变量之间存在线性相关。多重共线性的解决有多种经验性方法,这些方法因模型和样本数据的不同而各异,其中一类比较常用而且简单的办法是“剔除变量法”,即剔除引起多重共线性的解释变量,以达到解决多重共线性问题的目的。实施剔除变量法的关键是确定哪一个或哪些变量应该被剔除,因此需要确立剔除依据。文献[1,2]认为可以根据方差膨胀因子(VIF)的大小来选择被剔除变量,VIF最大的变量应首先剔除。该依据的理由是,VIF最大的变量与其余变量的相

    统计与决策 2013年5期2013-07-27

  • 解决多重共线性的新思路:路径分析
    释变量之间存在共线性,解释变量是随要变量用与随机项相关。在以上几种情况中,异方差、序列相关、随机解释变量模型等都有较好的解决方案,而多重共线性到目前为止尚没有非常好的解决方法,本文将路径分析引入多重共线性模型,作为解决多重共线性的一种思路,供大家参考。1 多重共线性回顾在回归模型中,如果某两个或多个解释变量之间出现了相关性,则称为存在多重共线性。多重共线性包括完全多重共线性和近似多重共线性,在实际经济统计数据中,完全多重共线性极为少见,一般出现的是近似共线

    统计与决策 2013年1期2013-05-10

  • 基于乌鲁木齐物流产业分析多重共线性
    上存在着一定的共线性;而对于截面数据常常也存在自变量高度自相关的情况,而存在着共线性会给模型带来许多不确定性的结果。一、多重共线性的认识(一)多重共线性的定义设回归模型y=β0+β1x1+β2x2+…+βpxp+ε如果矩阵X的列向量存在一组不全为零的p+1个数k0,k1,k2…kp使得k0+k1xi1+k2xi2+…+kpxip=0,i=1,2,…n,则称其存在完全共线性,如果k0+k1xi1+k2xi2+…+kpxip≈0,i=1,2,…n,则称其存在多

    东南大学学报(哲学社会科学版) 2013年2期2013-03-12

  • 诊断复共线性的特征分析法及其在GEO定轨中的应用
    11 引 言复共线性存在于很多测量数据处理问题中,它对估计结果有很大的影响。如果设计矩阵存在复共线性,很小的观测误差就有可能造成估计结果严重偏离真值。为了得到精确、可靠的平差结果,必须消弱和克服设计矩阵复共线性对参数估计的不良影响[1]。克服复共线性影响的前提是准确地找到设计阵中存在的复共线性关系,即进行复共线性诊断。到目前为止,国内外学者关于复共线性诊断已经提出了10余种方法[1-7],大致分为3大类:第1类是基于相关系数的方法,第2类是基于特征系统(特

    测绘学报 2013年1期2013-01-11

  • 多元分析中的多重共线性及其处理方法*
    变量间存在多重共线性的现象十分普遍,其结果可能导致治疗效果或暴露因素作用的估计产生偏性。研究者常常通过调整某些协变量或混杂因素来调整变量间的多重共线性,以评价某些治疗方法或暴露因素与疾病间的关系〔1-2〕。但这样不仅会损失掉信息,而且某些混杂因素难以达到治疗组间或暴露因素各水平间的平衡,降低检验效能,甚至使分析结果失真。不同的解决变量间多重共线性的统计学处理方法〔3-5〕均有各自的优缺点和适用范围,至今仍没有一种通用的解决方法。本文阐述目前常用的几种方法:

    中国卫生统计 2012年4期2012-03-11

  • 基于岭回归法对海南省住宅销售价格的影响因素的研究
    决自变量间多重共线性的问题,借助EVIEWS 6.0和SPSS17.0软件,建立相关的数学模型,最后预测海南省2009年住宅销售价格,结果表明模型短期预测精度较高.多重共线性;多元线性回归模型;岭回归海南建省以后,房价就一直迅速飙升,特别当国家宣布把海南岛建设成国际旅游岛后,海南省的商品住宅房房价就以更加惊人的速度在提高.因此,有必要对海南商品房的房价和所受的影响因素做一个简略的分析.以1996年至2009的《中华人民共和国统计年鉴》和《海南统计年鉴》的相

    海南师范大学学报(自然科学版) 2011年3期2011-12-07

  • 主成分回归的SPSS实现
    SPSS软件。共线性;主成分回归;特征值;特征向量;SPSS0 引言在进行多元线性回归分析时,经常会遇到自变量之间存在近似线性关系的现象,这种现象被称为共线性[1]。当共线性严重时,用最小二乘法建立的回归模型将会增加参数的方差,使得回归方程变的很不稳定,有些自变量对因变量影响的显著性被隐藏起来,某些回归系数的符号与实际意义不相符[2],回归方程和回归系数通不过显著性检验。处理共线性的主要方法有筛选变量法、岭回归法、主成分回归法、偏最小二乘法等。在文献[2]

    统计与决策 2011年5期2011-10-18

  • 多重共线性的检验及对预测目标影响程度的定量分析
    模型中存在多重共线性.多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果.多重共线性包含完全多重共线性和不完全多重共线性两种类型.理论上可以证明,当回归方程中的某些变量之间完全相关时,回归系数不存在;当自变量之间高度相关时,回归系数表现出不确定性,从而使回归系数的标准差大大增加.从应用角度看,由于多重共线性的存在,如果仅从回归系数的经济意义出发去解释经济现象,往往会得出一些与经济理论相反的结论.例如我们有时计算某厂的利润y、总产值x

    通化师范学院学报 2010年4期2010-01-25