下载此文档

线性回归分析教案.doc


文档分类:高等教育 | 页数:约19页 举报非法文档有奖
1/19
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/19 下载此文档
文档列表 文档介绍
该【线性回归分析教案 】是由【泰山小桥流水】上传分享,文档一共【19】页,该文档可以免费在线阅读,需要了解更多关于【线性回归分析教案 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案线性回归解析管理中经常要研究变量与变量之间的关系,并据以做出决策。前面介绍的检验能够确定两个变量之间是否存在着某种统计关系,但是若是检验说明两个变量之间存在着某种关系,我们还是不可以够说明它们之间终归存在什么样的关系。本章介绍的回归解析能够确定两个变量之间的详尽关系和这类关系的强度。回归解析以对一种变量同其他变量互有关系的过去的观察值为基础,并在某种精确度下,展望未知变量的值。社会经济现象中的好多变量之间存在着因果关系。这些变量之间的关系一般能够分为两类:一类是变量之间存在着完好确定的关系,即一个变量能被一个或若干个其他变量按某种规律唯一地确定,比方,在价格P确定的条件下,销售收入Y与所销售的产品数量之间的关系就是一种确定性的关系:Y=P·X。另一类是变量之间存在着某种程度的不确定关系。比方,粮食产量与施肥量之间的关系就属于这类关系。一般地说,施肥多产量就高,但是,即即是在相邻的地块,采用同样的种子,施同样的肥料,粮食产量仍会有所差异。统计上我们把这类不确定关系称为有关关系。确定性关系和有关关系之间经常没有严格的界限。由于测量误差等原因,确定性关系在实质中经常经过有关关系表现出来;另一方面,经过对事物内部发展变化规律的更深刻的认识,有关关系又可能转变成确定性关系。两个有关的变量之间的有关关系尽管是不确定的,但是我们能够经过对现象的不断观察,研究出它们之间的统计规律性。对这类统计规律性的研究就称为回归解析。回归解析研究的主要内容有:确定变量之间的有关关系和有关程度,建立回归模型,检验变量之间的有关程度,应用回归模型进行估计和展望等。第一节一元线性回归解析一、问题的由来和一元线性回归模型例7-1。某地区的人均月收入与同期某种耐用花销品的销售额之间的统计资料如表7-1所示。现要求确定两者之间可否存在有关关系。表7-(百万元),以人均收入xi为横轴,销售额yi为纵轴,把表7-1中的数据画在这个坐标系上,我们能够看出两者的变化有近似于直线的关系,所以,能够用一元线性回归方程,以人均收入为自变量,以销售额为因变量来描述它们之间的关系。即:yi=a+bxi+eii1,2,,n其中:yi是因变量Y的第i个观察值,xi是自变量X的第i个观察值与b是回归系数,n是样本容量,ei为对应于Y的第i个观察值的随机误差,这是一个随机变量。在上述线性模型中,自变量X是个非随机变量,关于X的第i个观察值xi,Y的观察值yi是由两个部分所构成的:bxi和ei,前者是一个常数,后者是一个随机变量,所以也是一个随机变量。关于上述回归模型中的随机误差ei要求满足以下的假设条件:1、应当是遵从正态散布的随机变量,即ei满足“正态性”的假设。2、ei的均值为零,即E(ei)=0,我们称ei满足“无偏性”的假设。3、ei的方差等于2ei=ei2,这就是说,所有的ei散布的方差都同样,即满足“共方差性”的假设。4、各个ei间相互独立,即关于任何两个随机误差ei和ejij其协方差等于零,即,Cov(ei,ej)=0,ij)这称之为满足“独立性”的假设。综上所述,随机误差必定遵从独立的同样散布。基于上述假设,随机变量的数学希望和方差分别是:E(yi)=a+bxi2ei=ei2由此:y~N(a+bx,e2)iii这就意味着,当X=xi时,yi是一个遵从正态散布的随机变量的某一个取值。若是不考虑式中的误差项,我们就获取简单的式子:yi=a+bxi这一式子称为Y对X的回归方程。依照这一方程在直角坐标系中所作的直线就称为回归直线。线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案二、模型参数的估计和估计平均误差1、回归参数的估计线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案回归模型中的参数a与b在一般状况下都是未知数,必定依照样本数据(xi,yi)来估计。确定参数a与b线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案值的原则是要使得样本的回归直线同观察值的拟合状态最好,即要使得误差最小。为此,能够采用“最小二乘法”的方法来解决。对应于每一个xi,依照回归直线方程(7-1)能够求出一个yi,它就是yi的一个估计值。估计值和观察值之间的误差eiyiyi。有n个观察值就有相应的n个误差。要使模型的拟合状态最好,就是说要使n个偏差的总和最小。但为了计算方便起见,我们以误差的平方和最小为标准来确定回归模型。这就要求n2n2Qyiyyiabxii1i1是个极小值。依照微积分中的极值定理,要使上式取极值,其对a与b所求的偏导数应为0,即Q2yiabxi0aQ2yiabxixi0b经整理后可得:yinabxixiyiaxibxi2解上式,可得:xiyi1xiyibn1xi2xi2nayibxinn记Xxin,Yyin。线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案SXXxi2xi212xxinSXYxixyixiyi1yiyxinSYYyi2yi212yyin于是,获取参数a与b的简单表达形式以下:SXYSXXaybx求出参数a与b今后,就可以获取回归模型yabx由此,只要给定了一个xi值,就可以依照回归模型求得一个yi来作为实质值yi的展望值。2、估计平均误差的计算关于给定的xi,依照回归模型就可以求出yi的展望值。但是用yi来展望y的精度如何,产生的误差有多大是统计上所关心的。统计上用估计平均误差这个指标来胸襟回归方程的可靠性,对回归方程进行谈论。估计平均误差能够用第一章中所述的胸襟一组观察值的离差的方法来胸襟。但是此次估计平均误差是依照观察值与回归直线的偏离来计算的。一个回归模型的估计平均误差或节余标准离差由下式定义:线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案Se1n2yiyi线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案n2i1线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案值得注意的是上式中分母是用n2而不是n1或n去除,这是由于n个观察值的数据点用于计算参数a与b时失去了2个自由度,还余下n2个自由度。运用估计平均误差能够对回归方程的展望结果进行区间估计。若观察值围绕回归直线遵从正态散布,且方差相等,%的点落在Se的范围内,%的点落在2Se的范围内,%的点落在3Se的范围内。三、回归模型的检验线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案回归方程建立今后还需要检验变量之间可否确实存在线性有关关系,由于对回归参数的求解过程其实不需要早先知道两个变量必然存在有关关系。对一元线性回归模型的统计检验包括两个内容:一是线性回归方程的显然性检验,二是对回归系数进行统计推断。线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案下面我们分别谈论这两个问题。(一)线性回归方程的显然性检验1、方差分解回归解析中需要解析使用Y与X之间的线性有关关系的估计模型yabx来估计y时所产生的误差和所减少的误差,这称为回归中的方差解析。若没有利用Y与X之间的有关关系来估计整体的均值,我们就会选择yi的平均值y作为整体的估计值。由此而产生的误差是yiyi2,我们称之为“总离差平方和”,记为SST。若利用Y与X之间的线性有关关系的估计模型去估计整体均值,则所产生的误差是:yiyi2SSE。为了说明SST与SSE之间的关系,我们对SST进行分,我们称之为残差平方和,记为解。SSTyiy2yiyyiyi2yiy2yi22yiyyiyiyiyi2yi2yyi0yiy2yi2yiyi2yiyi2若记SSR=yiSSE=SST=SSR+SSE图7-1:三种误差之间的关系线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案SSR反响了由于利用Y和X之间的线性回归模型yi来估计Y的均值时,而不是简单地利用y来估计Y线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案的均值时,使得总误差SST减少的部分,所以统计上称之为“可讲解误差”。线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案SSE是利用Y与X之间的线性回归模型来估计Y的均值时依旧存在的误差,所以称之为“不可以讲解误差”。线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案于是,上式实质上就表示:线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案差=可解差+不可以解差7-1直地表示了三种差之的互有关系。2、有关解析于任何定的一本(xiyi)(i=1,2,?n)都能够用最小二乘法建立起一个性回模型,相地即可以获取一条回直。但是,的一条回直其实不是有意的。只有当量X与Y之确存在某种因果关系,其回直才有意。学中要确定量X和Y之可否确存在性有关,平时利用有关系数来。有关系数作r或r2,它能精确地描述两个量之性有关的亲近程度。有关系数能够定可解差SSR和差SST之比,即:r2=SSR/SST=1-SSE/SST它反响了由于使用了Y与X之性回模型来估yi的均而使离差平方和SST减少的程度,从而表示Y与X之性有关程度及合模型的良程度。r2与SSR成正比。r2越大,明Y与X之的性有关程度越高,也就明模型的合性能;r2越小,明Y与X之的性有关程度越低,明模型的合性能差。当有关系数用r来表示不可以够定Y与X之的有关程度,而且也能够表示相关的方向。事上,有关系数r也能够定:rSXYSXXSYY从上述两个公式算所获取的果完好同样,意也同样。但从r2算r:rr2要确定r的符号,就需要利用以下的关系:rSXYbSXXSXXSYYSYY由此可,r与b同号,能够依照b的符号来决定r的符号。从r2的算公式能够看出:r2是界于0与1之的,即0r21。若是yiyi,SST=SSR,SSE=0,此,r2=1。称完好性有关,模型的合程度最。用Y与X之的性回模型来估yi的离差和完好能够用SSR来解。若是yiy,SST=SSE,SSR=0,所以,r2=0。,使用Y与X之的性回模型没有能任何的离差平方和SST作出任何解,明Y与X之事上无性有关,模型的合程度最差。r的不同样的详尽,Y与X之的有关关系解析以下:1)当r=1,称完好性正有关;当r=-1,称完好性有关。线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案2)当0<r<1时,Y与X存在必然的线性有关。当r>0时称Y与X正有关。当r<0时称Y与X是负线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案有关。一般地说,r2,估计模型为"优";,估计模型为"良";,线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案估计模型为"一般"。r2"差"。但是,要精确地说明两个变量可否确实拥有线性有关线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案关系,一般还需要作其他的一些检验。3、F检验法线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案在一元线性回归模型中,若b=0,则X的变化不会引起Y的变化,即此,线性回归方程的显然性检验能够经过回归方程的F检验来完成。Y与X不拥有线性有关关系。因线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案我们提出H0:b=0,H1:b0,则在H0建立,即Y与X之间不存在线性有关的条件下,统计量y21SSRFyn2yy22SSEnr21r2n2遵从自由度为1,n-2的F散布。在给定了检验的显然性水平今后,可由F散布表获取H0成马上的临界值F0,若是关于一组样本计算得出的统计量F的值大于F0,则否定H0,即b0,说明X与Y之间确定存在线性有关关系。所以,对回归方程的有关性检验可按以下步骤作F检验:1)提出假设H0:b=0,H1:b0,SSR2)在H0成马上,统计量n2~F1,n2关于给定的显然性水平,查F散布表获取检验的临界值SSEF0。线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案3)关于一组样本计算SSR和SSE,并由此获取F值。线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案4)比较F与F0的值,若F>F0,则拒绝零假设。我们认为X与Y之间存在线性有关关系,否则接受H0,线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案认为X与Y之间没有线性有关关系。4、t检验线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案rYxr计算获取的,所以拥有必然的随机性,样本容量越小,其随机性就越大。所以也需要经过样真有关系数r对线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案整体的有关系数作出推断。由于有关系数r的散布密度函数比较复杂,实质应用中需要对r作变换。令线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案rn2t1r2则统计量t遵从t(n-2)散布。于是关于整体可否线性有关的问题就变成对整体有关系数=0的假设检验,也就只要对统计量t进行t检验就行了。依照一组样本计算出上述t值,再依照问题所给定的显然性水平和自由度n-2,查t散布表,找到相应的临界值t。若2tt2表示t在统计上是显然的,即整体的两个变量间存在线性关系。否则就认为两个变量间不存在线性关系。5、D·W检验回归模型中假设Cov(ei,ej)=0,即随机项是独立的。这一假设可否建立,能够经过回归模型的误差序列可否相互独立来进行检验。若误差序列各项间相互独立,则序列各项之间没有有关关系。若序列各项之间有有关关系,误差序列不满足线性回归模型的基本假设,回归模型就不可以够表达变量Y与X之间的真实变动关系。D·W(Durbin-Watson)检验能够检验残差序列的有关性。其检验方法以下:1)计算误差序列的d统计量(D·W值)n2n2deieiei1i2i12)依照给定的显然性水平(平时为=),自变量个数k和样本数据个数n,查D、W表,获取d的下限值dl和上限值du。3)判断。若du<d<4-d则残差序列无自有关,各项间相互独立;线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案若0<d<dl或4-dl<d<4线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案表示残差序列存在正自有关或负自有关,各项之间不相互独立,D·W检验未经过;若线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案dlddu或4-dud4-dl线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案则无法判断可否存在自有关。线性回归模型产生残差序列自有关的原因有三种,第一是所选择的数学模型不合适,变量间不是线性关系而建立了线性模型。此时应进一步选择合适的数学模型。第二是模型中所包括的自变量数量不合适,或是遗漏了某些重要的影响因素,或是包括了不用要的其他因素。第三是序列中包括有很强的趋势重量。平时能够用迭代法或差分法进行修正。经济指标的时间序列经常存在自有关现象,这一点特别要注意。线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案(二)关于回归系数b的统计推断线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案由于样本不同样,回归系数机变量Y的线性组合,所以a与b的值也不同样,所以。回归系数a和b也是遵从于正态散布的随机变量。a和b也是随机变量。同时,可得Ebb22beSxx一般状况下2未知,需要用其无偏估计量S2来代替:eebSe2Sxx依照t散布原理,样本统计量tbbb遵从于自由度为(n-2)的t散布。于是要检验回归参数b可否等于某一假设值b0的问题,也就转变成假设检验问题。检验的程序是;1)设H0:b=b0,H1:bb0,2)计算统计量tbb0b3)判断原假设可否建立。当显然性水平为时,查t散布表得t和t,若tt1或tt,则21222拒绝H0,反之接受H0。,能够确定b的置信区间。由于P(ttt12)=1-2所以,当置信度为1-时,b的置信区间是btb,bt1b22第二节多元线性回归解析一、多元线性回归模型线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案多元线性回归解析是研究一个因变量与多个自变量之间线性有关关系的统计解析方法。事实上,大量社会经济现象总是多个因素作用的结果。多元线性回归考虑到多个自变量对因变量的影响,能够更真实地反响现象之间的互有关系,所以在实践中应用更广。线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案假设一个随机变量Y与m个非随机变量X之间存在线性有关关系,则它们之间的关系能够用以下的线性回归模型来表示:Y01X12X2mXme其中:Y是因变量,Xii1,2,m是自变量,ii0,1,2,m是模型的参数,称为偏有关系数。是随机误差。关于上述模型中的非随机变量Xi的第j个取值Xij,Y的观察值Yj由两部分构成:(01X12X2mXm)和ej。前者是个常数,后者是个随机变量,所以Yj也是个随机变量。与一元线性回归模型同样地,我们也必定假设多元线性回归模型中的误差项必定满足正态性、无偏性、共方差性和独立性的条件。假设e~N0,e2,则EY01X12X2mXme01X12X2mXm2Y201X12X2mXme02e2e因此可知:Y~N01X12X2mXm,e2。二、参数估计多元线性回归模型的参数ii0,1,2,m及e2在一般状况下都是未知数,必定依照样本数据yJ,x1j,x2j,,xmj来估计。回归参数ii0,1,2,m的估计方法还是"最小二乘法"。依照样本数据yJ,x1j,x2j,,xmj来估计ii0,1,2,m时使得产生残差的平方和Qyjyj22yj01x1jmxmj线性回归解析教课方案线性回归解析教课方案线性回归解析教课方案

线性回归分析教案 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息