斯皮尔曼相关性分析及多重共线性和相关性检验

您所在位置: &
&nbsp&&nbsp&nbsp&&nbsp
实验五__多重共线性检验参考案例.doc 16页
本文档一共被下载:
次 ,您可全文免费在线阅读后下载本文档。
下载提示
1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
2.该文档所得收入(下载+内容+预览三)归上传者、原创者。
3.登录后可充值,立即自动返金币,充值渠道很便利
你可能关注的文档:
··········
··········
多重共线性检验
实验时间:
【实验目的】【实验】为随机干扰项,考虑一下回归模型:
将该年度平均工作小时数Y对X进行回归,并对模型进行简单分析;
计算各变量之间的相关系数矩阵,利用相关系数法分析变量间是否具有多重共线性;
利用逐步回归方法检验并修正回归模型,最后再对模型进行经济意义检验、统计检验。
【实验过程】
一、利用Eviews软件建立年度平均工作小时数y的回归模型。
(一)首先创建Workfile(命令窗口输入Create U,再输入35个样本观测值),其次输入数据Y,X1,X2,X3,X4,X
正在加载中,请稍后...当前位置:经济学题库>
问题:  &#xe6
[填空题] 检验样本是否存在多重共线性的常见方法有:()和逐步回归法。
要使圆弧线段显示得光滑些可用()命令。 ["REGEN","REDRAW","VIEWRES","FACETRES","SHADE"]
加热炉排出的烟气温度很高,运行中一般在()℃左右。 ["A、100","B、150","C、200","D、250"]
在信号微机监测系统车站系统上位机通过()与外界进行数据交换。 ["A、下位机","B、CAN卡","C、高速串口","D、网卡"]
在模型空间,用于多个视窗显示的命令是() ["UCS","VPORTS","VIEWS","VPOINT"]
在多元线性回归模型中,解释变量间呈现线性关系的现象称为()问题,给计量经济建模带来不利影响,因此需检验和处理它。
检验样本是否存在多重共线性的常见方法有:()和逐步回归法。
参考答案:判定系数检验法
●&&参考解析从统计看机器学习(二) 多重共线性的一些思考
时间: 20:15:06
&&&& 阅读:119
&&&& 评论:
&&&& 收藏:0
标签:  从一个生活中的现象说起:我们在装机时,不会安装一款以上的解压软件,也希望被莫名其妙地安装额外的管家。与此相反,我们会安装多款播放器。那么,这是为什么呢?当然,也可以思考这样一个问题,好评的软件那么多,硬盘又足够大,为什么不都装上?看到第二个问题,思路似乎清晰了。很简单,解压软件、管家的功能大同小异,且都免费,甚至不需要考虑到底用哪个,似乎只要有那么一个就好了。但是,播放器有单机、网络之分。即使均为网络播放器,仍会搜索到不同资源...即使播放器之间看似相同。
在1996年,还在读书的Tim C. Hesterberg问斯坦福大学的统计学家Bradley&Efron这样一个问题:&在统计学领域什么问题最重要?&他满以为Efron会回答给予他崇高地位的Bootstrap算法,结果Efron的回答却是变量选择。
  用不同的软件类比不同的变量,装机变成了一个变量选择的问题,选择恰到好处的软件使用户满意度达到最大。
1.由多元线性回归建模说起
  我们考虑这样的用户满意度评价问题:一款软件的满意度可由用户评分(0~5分)和专家评分(0~5分).用户评分有主观因素,不同用户对同一软件的评分一般不同。专家评分会系统地考虑产品、技术等层面,更为客观,即对同一软件的评分可认为是相同的。我们将用户评分与专家评分的乘积表示一位用户对一款软件的满意度。乘积可以综合用户体验与实际价值,又可以让二者相互制约,更能反映出真实的用户满意度。那么,如果我们有用户的总体满意度以及他们对软件的评分数据,能不能通过数据估计出每款软件的专家评分?即能不能通过建立回归模型客观地得到软件优劣?
  假设用户数为n软件数为p.根据上面的主观与客观评分假设,我们用列向量y=(y1,y2,...,yn)T表示每一位用户的满意度;矩阵X有n行p列,第i为用户i对p款软件评分为xi=(xi1,xi2,...,xip);专家评分表示为&=(&1,&2,...,&n)T.很显然,满意度评分问题的模型是y=X&+&,&代表误差项。我们要通过一组包含用户满意度-评分的数据估计出& .似乎理论上可以得出客观层面的软件优劣。
2.一个简单的模拟实验
  我们仍然运用最小二乘法,与上一篇相比,这次是使用多元线性回归的最小二乘法。不过道理相同,获得向量&的估计值,每一位用户评分带入都会得到该用户满意度估计值,并使全部用户的满意度估计值与真实值的误差平方和达到最小。
  回到第一段的问题一,我们假设只研究两款压缩软件x1,x2.根据问题一的假设,由于用户觉得他们二者不存在差异,因此对两款软件的评分会非常接近。但专家从客观层面评价二者还是有一定的区别的,对两款软件的评分是&1=3.5和&2=4.5.那么用户满意度的真实模型为y=3.5x1+4.5x2+&.假设有10位用户,且用户间的评价存在一定差异,根据本段做出如下表格:
  在R语言中,我们建立多元线性回归模型对&1,&2进行估计:
x1 &- c(1.7, 2.0, 2.3, 2.5, 2.7, 3.3, 3.8, 4.3, 4.6, 4.9);
x2 &- c(1.7, 2.2, 2.4, 2.6, 2.9, 3.1, 4.0, 4.1, 4.8, 5.0);
e &- c(0.9, -0.5, 0.5, -0.6, 0.4, 2.1, 1.7, 0.4, -1.7, -1.3);
y &- 3.5 * x1 + 4.5 * x2 +
model &- lm(y ~ x1 + x2)
summary(model)
Residuals:
Max -0.0 -0.0
Coefficients:
Estimate Std. Error t value Pr(&|t|)
(Intercept)
0.0221 *x2
---Signif. codes:
0 &***& 0.001 &**& 0.01 &*& 0.05 &.& 0.1 & & 1
Residual standard error: 1.125 on 7 degrees of freedomMultiple R-squared:
Adjusted R-squared:
0.9833 F-statistic: 265.9 on 2 and 7 DF,
p-value: 2.501e-07
&  真实模型为:y=3.5x1+4.5x2+&.
  最小二乘法回归模型为:y=7.0096x1+0.5953x2+1.7315.
  二者相差如此之悬殊,但模型的调整后回归系数(Adjusted R-squared)却达到了0.9833,模型严重失真,但拟合效果仍是很好的。当然,我们的真实模型中没有引入常数项,如果有,恐怕x2的系数&2会被估计成负数。显然,之前规定了评分在0~5之间,那么回归结果会更明显地表现出是虚假的。那么,为什么会这样呢?原因很简单,数据中存在高度相关的变量(x1,x2的相关性高达0.987),这两个变量步调如此相似,像两条平行的向量,也就是说二者是共线的。通俗一些,由于两款软件太相似了,以至于无法判断谁能贡献出更大的用户满意度,二者10:0开,5:5开,0:10开几乎无任何差别。
  从上面的结果也可以看出,&1的标准误差达到了2.3947而&2的达到了2.4084.即使最小二乘法的估计是无偏的,它也不再有效了。在中我们说到了最小二乘法是无偏估计中最好的。这也暗示出为了估计的有效,我们会在一定程度上牺牲无偏性来换取有效性,采用岭回归、主成份等有偏的方法。
3.多重共线性是普遍存在的
  在统计学或机器学习的一些截面数据的多元回归问题中,X为n&p的二维矩阵,但通常情况下p&n.这就是高维复杂数据,之所以引入大量的变量就是因为它们通常都有信息,但研究者并不清楚到底多少变量有用。变量多了,变量和变量之间会共线,也很容易出现一个变量被其他几个变量线性表述的情况(一个功能冗杂的软件被其他垂直细分但功能专精的软件代替),这种被代替情况就是所谓的多重共线性。我们需要进行变量选择,否则很容易造成虚假回归。
  普林斯顿大学统计与金融工程的终身教授,"The Annals of Statistics" 杂志的主编范剑青教授在一篇论文中做过这样一个模拟实验:
随机生成n=50,Z1,...,Zp~i.i.d.的样本,分别计算p=1000和p=10000时的Z1与Zj,j&2的相关系数绝对值中最大值以及分布(左图),以及的Z1与其他5个变量的多重相关性绝对值中的最大值以及分布(图右).不难发现,无论1000个变量还是10000个变量,随机模拟出的变量几乎没有与Z1共线的,即几乎没有与Z1高度相关的。即使变量数增加了10倍,出现更高相关性的可能也未增加太多。但是,从随机模拟出的1000个变量中任选5个非Z1变量进行线性组合,都很容易与Z1高度相关,即产生了多重共线性。当变量数达到了10000时,多重共线性发生的概率更大了,而且相关性也普遍增强了。
  很显然,无论是1000个变量还是10000个变量,相对于实际问题,变量数并不大。在随机模拟实验下,高维数据的多重共线性都会100%存在,况且,实际问题会这样的随机么?标签:原文地址:http://www.cnblogs.com/miluroe/p/5365412.html
&&国之画&&&& &&&&chrome插件
版权所有 京ICP备号-2
迷上了代码!关于多重共线性检验方法的研究--《中国煤炭经济学院学报》2001年04期
关于多重共线性检验方法的研究
【摘要】:首先指出多重共线性是指解释变量观测值矩阵 X的秩小于待估参数个数 ,以及存在多重共线性带来的严重影响 ;其次介绍了 8种检验多重共线性的方法 ,并加以简要评述 ;最后特别强调近几年对多重共线性研究的成果 ,介绍了有别于从变量出发的数据影响点的新思路 ,给出两种多重共线性影响点的诊断方法——特征分析法及主成分诊断法。
【作者单位】:
【分类号】:F224.0
欢迎:、、)
支持CAJ、PDF文件格式,仅支持PDF格式
【引证文献】
中国期刊全文数据库
姚俊;;[J];常州工学院学报;2010年05期
郭静雯;;[J];广州大学学报(自然科学版);2007年04期
姚俊;;[J];统计与决策;2011年02期
赵红平;;[J];统计教育;2007年09期
中国博士学位论文全文数据库
唐利民;[D];中南大学;2011年
葛宏伟;[D];东南大学;2006年
郭福涛;[D];东北林业大学;2010年
中国硕士学位论文全文数据库
尚喆超;[D];东北林业大学;2011年
侯健;[D];西南交通大学;2011年
吕林;[D];东南大学;2006年
张肖肖;[D];华中科技大学;2008年
谷也;[D];哈尔滨工业大学;2009年
吴晓丽;[D];西南林学院;2009年
于晓牧;[D];大连医科大学;2010年
冯太群;[D];西南交通大学;2012年
【共引文献】
中国期刊全文数据库
李晓敏;丁士军;;[J];安徽农业科学;2006年12期
袁莹莹;;[J];安徽农业科学;2006年20期
常璐;;[J];安徽农业科学;2007年04期
钟远东;陈昭玖;魏金连;;[J];安徽农业科学;2007年36期
张锦;;[J];北方经济;2006年16期
张丽;;[J];北方经济;2007年06期
张远为;;[J];北方经济;2008年10期
杨永忠;[J];北京航空航天大学学报(社会科学版);2005年01期
黄平;[J];北京工业大学学报;1988年01期
吴忠,李冰,王树森;[J];北京化工学院学报(自然科学版);1993年01期
中国重要会议论文全文数据库
栾敬东;苏向妮;;[A];安徽省社会科学界第三届学术年会哲学学会专场——“科学发展观与安徽崛起”论坛论文集[C];2008年
朱俊生;;[A];变革中的稳健:保险、社会保障与经济可持续发展——北大CCISSR论坛文集·2005[C];2005年
赵丽佳;冯中朝;;[A];湖北省人民政府第三届湖北科技论坛“三农问题与农业综合生产能力提高”分论坛论文集[C];2005年
杨校礼;;[A];第三届全国水力学与水利信息学大会论文集[C];2007年
中国博士学位论文全文数据库
许洪贵;[D];北京交通大学;2011年
祁春节;[D];华中农业大学;2001年
周英章;[D];浙江大学;2002年
张天明;[D];河海大学;2002年
杨大鸣;[D];武汉理工大学;2003年
张德亮;[D];浙江大学;2003年
范德成;[D];哈尔滨工程大学;2003年
陈铭恩;[D];华中农业大学;2002年
葛新权;[D];首都经济贸易大学;2004年
刘艳武;[D];吉林大学;2004年
中国硕士学位论文全文数据库
吴飞;[D];湖南农业大学;2010年
丁一;[D];沈阳工业大学;2010年
余志高;[D];首都经济贸易大学;2011年
刘慧;[D];哈尔滨师范大学;2011年
郑美丽;[D];河南师范大学;2011年
陈端吕;[D];中南林学院;2001年
徐圣兵;[D];湘潭大学;2001年
莫夏云;[D];中南大学;2002年
蒋佐斌;[D];武汉科技大学;2001年
向绪宁;[D];湖南大学;2002年
【同被引文献】
中国期刊全文数据库
覃惠英,郑美春,温咏珊,张惠芹,王玲燕;[J];癌症;2004年S1期
万崇华;孟琼;罗家洪;汤学良;张灿珍;卢玉波;杨铮;张晓磬;;[J];癌症;2007年02期
赵鹏,藤原章正,杉惠赖宁;[J];北方交通大学学报;2000年06期
荣建,常成利,刘小明,任福田;[J];北京工业大学学报;1999年04期
杨孝宽;曹静;宫建;;[J];北京工业大学学报;2008年01期
李崇贵,李春干;[J];北京林业大学学报;2004年05期
冯仲科;刘永霞;;[J];北京林业大学学报;2005年S2期
杨洪晓,吴波,张金屯,林德荣,常顺利;[J];北京师范大学学报(自然科学版);2005年02期
丁士俊;靳祥升;;[J];测绘科学;2006年02期
冯遵德;卢秀山;郭英;周兴东;;[J];测绘科学;2006年04期
中国博士学位论文全文数据库
查旭东;[D];长安大学;2001年
王振杰;[D];中国科学院研究生院(测量与地球物理研究所);2003年
贺跃光;[D];中南大学;2003年
刘华;[D];西北农林科技大学;2005年
肖兴威;[D];东北林业大学;2005年
邢艳秋;[D];东北林业大学;2005年
文鸿雁;[D];武汉大学;2004年
陈晓娟;[D];吉林大学;2006年
葛宏伟;[D];东南大学;2006年
何保红;[D];东南大学;2006年
中国硕士学位论文全文数据库
尹小梅;[D];长沙理工大学;2010年
何赟;[D];西南交通大学;2011年
叶兵;[D];中国林业科学研究院;2000年
王敬东;[D];大连理工大学;2003年
李苗苗;[D];中国科学院研究生院(遥感应用研究所);2003年
张锋;[D];东北林业大学;2003年
韩宏;[D];山西医科大学;2002年
赵良渊;[D];山西医科大学;2002年
陈盛;[D];东南大学;2004年
殷杰;[D];南京林业大学;2005年
【二级引证文献】
中国期刊全文数据库
龚晓岚;魏中华;;[J];华南理工大学学报(自然科学版);2008年10期
胡梦奇;黄新民;蔡东烜;李波;诸葛刚;易龙;;[J];中国商界(上半月);2010年11期
王江;;[J];交通标准化;2008年06期
张欣环;赵磊;晏克非;;[J];交通与运输(学术版);2010年01期
姜镇;刘灿齐;;[J];交通科技与经济;2010年06期
王秋平;丁禹元;徐乐;贺萌;龚烁;;[J];交通科技与经济;2011年03期
魏冉冉;徐天蜀;;[J];绿色科技;2013年02期
杨晓飞;马健霄;仲小飞;;[J];森林工程;2011年01期
龚翔;陈学武;李娅;;[J];土木工程学报;2011年11期
杨静;张蕊;吴海燕;张哲宁;毛保华;;[J];交通运输系统工程与信息;2011年03期
中国重要会议论文全文数据库
朱志高;李铁柱;;[A];2007第三届中国智能交通年会论文集[C];2007年
中国博士学位论文全文数据库
汤旻安;[D];兰州交通大学;2011年
杨素珍;[D];中国地质大学(北京);2008年
杨静;[D];北京交通大学;2010年
何迪;[D];西南交通大学;2009年
张本;[D];武汉理工大学;2010年
赵莉;[D];北京交通大学;2012年
席新明;[D];西北农林科技大学;2012年
王强;[D];东北林业大学;2012年
刘丹;[D];东北林业大学;2012年
陶思宇;[D];西南交通大学;2012年
中国硕士学位论文全文数据库
李晓雪;[D];北京交通大学;2010年
都舒;[D];北京交通大学;2010年
张强;[D];昆明理工大学;2009年
宗庆梅;[D];武汉理工大学;2010年
李静涛;[D];石家庄铁道学院;2010年
丁月旻;[D];中国科学院研究生院(海洋研究所);2011年
岳强;[D];北京交通大学;2011年
廖唱;[D];北京交通大学;2011年
刘书剑;[D];北京林业大学;2011年
宋欣;[D];东北林业大学;2011年
【相似文献】
中国期刊全文数据库
赵松山,白雪梅;[J];中国煤炭经济学院学报;2001年04期
陈伟;;[J];中国高等教育评估;2003年02期
张峭;[J];山西财经大学学报;1992年06期
葛培运;;[J];科技信息;2009年27期
陈宗胜;[J];生产力研究;1998年05期
姚俊;;[J];常州工学院学报;2010年05期
叶天勇;[J];统计与决策;1987年Z1期
郭其阳;;[J];数量经济技术经济研究;1990年04期
田俊忠;[J];固原师专学报;1996年03期
黄恒君;项泾渭;刘晓梅;;[J];甘肃科学学报;2007年02期
中国重要会议论文全文数据库
游华;;[A];2003中国现场统计研究会第十一届学术年会论文集(上)[C];2003年
赵莽;林齐宁;;[A];通信发展战略与业务管理创新学术研讨会论文集[C];2005年
赵明清;张靖;;[A];中国企业运筹学[C];2006年
颜彦;刘若凡;;[A];节约集约用地 促进可持续发展[C];2005年
赵宏杰;;[A];第二次全国中西医结合诊断学术研讨会论文集[C];2008年
张永清;费红琳;丁凯;;[A];第九届全国计算(机)化学学术会议论文摘要集[C];2007年
李雪花;陈景文;张丽;乔显亮;黄丽萍;;[A];持久性有机污染物论坛2007暨第二届持久性有机污染物全国学术研讨会论文集[C];2007年
徐维新;古松;赵新全;;[A];第26届中国气象学会年会气候变化分会场论文集[C];2009年
陈钦;黄种发;;[A];低碳经济时代的林业技术与管理创新[C];2010年
刘雅晴;周葵;;[A];2008中国可持续发展论坛论文集(2)[C];2008年
中国重要报纸全文数据库
赵惟;[N];人民邮电;2003年
广发证券股份有限公司 何沛俐 章早立;[N];证券时报;2003年
Artigas 广发期货研究中心
陈贝尔;[N];期货日报;2010年
孟斯硕;[N];第一财经日报;2010年
孙自铎 张谋贵;[N];安徽日报;2010年
郭省钰 刘露 山西财经大学;[N];山西经济日报;2011年
中国博士学位论文全文数据库
张超;[D];南方医科大学;2008年
罗伟林;[D];上海交通大学;2009年
武中臣;[D];南开大学;2006年
杨杨;[D];浙江大学;2008年
张勇;[D];中国科学技术大学;2006年
刘景;[D];江南大学;2008年
胡念梅;[D];厦门大学;2009年
徐晓燕;[D];中国科学技术大学;2006年
文拥军;[D];西北农林科技大学;2009年
何伟;[D];西南交通大学;2006年
中国硕士学位论文全文数据库
于晓牧;[D];大连医科大学;2010年
张凤莲;[D];华南理工大学;2010年
毕伯竹;[D];山东大学;2011年
赵芬;[D];燕山大学;2012年
周菲;[D];兰州大学;2011年
孔朝莉;[D];辽宁师范大学;2004年
刘红卫;[D];西南交通大学;2006年
许晓霞;[D];北京交通大学;2007年
何秀丽;[D];华中科技大学;2005年
丁磊;[D];新疆大学;2007年
&快捷付款方式
&订购知网充值卡
400-819-9993豆丁微信公众号
君,已阅读到文档的结尾了呢~~
线性回归方程中多重共线性诊断方法及其实证分析(PDF),线性回归方程,线性回归方程公式,一元线性回归方程,线性回归方程怎么求,excel线性回归方程,线性回归方程例题,多元线性回归方程,一元线性回归方程公式,线性回归方程相关系数
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
线性回归方程中多重共线性诊断方法及其实证分析(PDF)
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='http://www.docin.com/DocinViewer--144.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口

我要回帖

更多关于 多重共线性检验 的文章

 

随机推荐