单变量和单个单因素方差分析的例子回归分析中都呈现显著相关,两个变量一起做回归分析中一个变量又不显著相关,是怎么回事

相关性显著,但是回归不显著是为什么_百度知道
相关性显著,但是回归不显著是为什么
之前先做的相关性分析,发现有几个变量和因变量有显著相关。再把有相关的变量拿出来单独做回归分析就发现,其中有一个变量不显著了,这是为什么,或者这说明了那个变量什么问题?能说...
之前先做的相关性分析,发现有几个变量和因变量有显著相关。再把有相关的变量拿出来单独做回归分析就发现,其中有一个变量不显著了,这是为什么,或者这说明了那个变量什么问题?能说的浅显易懂一些吗?我不是专业人士
答题抽奖
首次认真答题后
即可获得3次抽奖机会,100%中奖。
一小时60题知道合伙人
来自科学教育类芝麻团
一小时60题
采纳数:98
获赞数:5535
参与团队:
一般相关只是单独地分析两个变量之间的相关,它不会去控制其他变量的影响。回归的话如果放入多个自变量做回归,那么看到的某一个自变量的回归系数其实代表的是控制了其自变量(也就是减去了其他自变量对因变量的效应)后的回归,也就是说,并不代表该变量单独对因变量的影响。差别就在于是否控制了所关注变量外的其他变量
中子37知道合伙人
采纳数:707
获赞数:8469
一般相关只是单独地分析两个变量之间的相关,它不会去控制其他变量的影响。回归的话如果你放入多个自变量做回归,那么你看到的某一个自变量的回归系数其实代表的是控制了其他自变量(也就是减去了其他自变量对因变量的效应)后的回归,也就是说,他并不代表该变量单独对因变量的影响。差别就在于是否控制了所关注变量外的其他变量
本回答被提问者采纳
为你推荐:
其他类似问题
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。多元回归分析应注意的两个问题_百度文库
您的浏览器Javascript被禁用,需开启后体验完整功能,
享专业文档下载特权
&赠共享文档下载特权
&10W篇文档免费专享
&每天抽奖多种福利
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
多元回归分析应注意的两个问题
&&本文讨论了多元回归分析主要可用于解决的问题,和分析时容易出错的问题(样本含量n和自变量个数k之间的关系,自变量之间相关的问题)
阅读已结束,下载本文需要
定制HR最喜欢的简历
下载文档到电脑,同时保存到云知识,更方便管理
加入VIP
还剩2页未读,
定制HR最喜欢的简历
你可能喜欢SPSS在进行多元线性回归分析时,为什么模型中要剔除某些维度,求依据?_百度知道
SPSS在进行多元线性回归分析时,为什么模型中要剔除某些维度,求依据?
浙江卫视123知道合伙人
浙江卫视123
采纳数:3694
获赞数:29100
因为在多元回归分析的过程中,会自动剔除一些对于因变量无显著影响的变量你只是用简单相关分析的不准确,有可能是变量之间存在一些共线性 所以导致单个都相关,而在多元回归分析时 会有些变量被剔除了,回归方程可以用,但是哪几个不显著的变量无法列入的从数据分析的角度来说,哪几个变量已经没有什么意义了哦,
QQ知道合伙人
采纳数:3018
获赞数:2182
因为不是显著的我经常帮别人做这类的数据统计分析的
qazonly123知道合伙人
qazonly123
采纳数:3332
获赞数:4417
没有影响或者存在共线性,就提出了啊专业数据分析
如果是做相关时,这个维度和因变量之间存在显著相关呢?
那就是存在共线性了
为你推荐:
其他类似问题
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。回归分析中t检验与F检验关系的进一步探讨
0引言t检验与F检验是多元线性回归分析中常用的统计检验方法。前者是对单个变量显著性的检验;后者则是检验解释变量的整体对被解释变量影响的显著性。众所周知,对于一元线性回归模型,F检验与t检验是等价的;而对于二元以上的多元回归模型,解释变量的整体对被解释变量的影响是显著的,并不表明每一个解释变量对它的影响都显著。因此在做完F检验后还须进行t检验。那么,在多元回归分析中,当F检验没有通过时,是否还有必要再进行t检验?当存在显著的解释变量时,是否还有必要再进行F检验?在什么情形下t检验与F检验能同时通过?本文将对此进行较深入地探讨。1一种错觉及反例在建立多元线性回归模型时,t检验是用于检验回归方程各个参数是否显著为0的单一检验,F检验是检验所有解释变量的系数是否同时为0的联合检验。对于初学者,可能会认为:若F检验接受原假设,即所有斜率系数都显著为0,则没有必要再进行t检验了;反之,若有一个变量通过了t检验,即至少有一个解释变量的系数显著...&
(本文共3页)
权威出处:
一、引言经济模型中带虚变量回归分析的正规方程的系数矩阵不是满秩的,因此无法通过克莱姆法则求解,这就给解正规方程带来很大不便。那么,这类正规方程解的构成是怎样的形式,具体又如何求解,这就是本文所要解决的问题,在这里求解过程主要是借助正规方程系数矩阵自身所具备的一些特殊的优越性质,深入分析方程解的结构,进而求解的。二、正规方程的导出1.反应矩阵(1)反应经济模型中当自变量以虚变量出现时,以i代表样本,j代表自变量,k代表虚变量水平,用变量表示第i个样本第j个自变量取第k个水平的反应,即:(2)反映矩阵将有n个样本,m个自变量,其中第j个自变量有rj个水平的反应表写成矩阵的形式称为反映矩阵,记为:;矩阵中元素不为0即为1。2.正规方程导出(1)方程的导出设n表示样本容量;有m个自变量,其中有个水平,;这些变量与因变量y有统计的线性关系;是依赖于第j个自变量的待估参数;是误差,假定相互独立且同分布;再设:,,则线性关系式可记为:,其矩阵...&
(本文共2页)
权威出处:
在日常的体育教学科研中经常会遇到一个变量随着另一个(或几个)变量而变化,它们之间的这种变化关系可以通过方程式来表示出来,从而可以通过某一个(或几个)自变量的数值变化推断或估计出另一个自变量,在统计学中称回归分析。回归分析在体育教学科研中都有着重要的作用,例如,在运动员的选材过程中通过足长、上肢长和下肢长等各项指标数据建立回归方程预测未来的身高;以课的练习密度和项目类型来预测学生的平均心率等。现在体育院系中用的教材大都是以传统方式来建立回归方程并进行分析的,这样的计算不但费时费力,而且还容易出错,本文通过一个实际的例子来介绍在体育教学科研中如何在SPSS中建立回归方程运用回归分析。1回归分析原理及其方程模型1.1回归分析原理当某几个变量之间存在相互影响、相互制约关系时,即其中一个量的变化会影响另一个变量也发生某种程度的变化,但是这种变化不是精确的,只能粗略地表示出另一个变量的估计值,变量间的这种关系称为相关关系。当变量间存在相关关...&
(本文共2页)
权威出处:
回归分析是数理统计学中处理变量之间定性关系,如纺织上某种纱线的强力与回潮相关关系的一种数学方法,即定量的建立-率大小有关,但回潮率一定时,纱线的强力也个变量和另一个变量或几个变量之间的数学不相同,这种变量之间的关系称相关关系.表达式。依据数学表达式达到对变量进行预回归分析的任务就是要在大量试验观察数据测和控制的目的.因此回归分析方法得到广的基础上找出这种相关变量之间的内在规泛的应用.律.在实际问题中,变量之间存在一种非确笔者在某厂试验室对30支原棉纱的回潮率与单纱强力,三年的资料随机抽查了14对在6~7.510之间,而此时回潮率对棉纱强数据,如附表.力影响显著,为此对所求回归方程进行预测第一步,作回归直线分析计算,得。和控制,计算:S—^/一9一卜147飞歹n一二b=24.85a=104.77Q二Syy*Y’Syv=(1*。967’)X从而回归直线方程为y=104.77+.11,则S=7.22,给定2485...&
(本文共3页)
权威出处:
1引言主成分分析和线性回归分析是多元统计分析中的两个基本方法,广泛应用于自然科学和社会科学的多个领域[‘一3}.而且两者常被结合使用,如先对初始样本进行主成分分析,然后利用前几个主成分进行回归【4一”].由于主成分分析和线性回归分析都依赖于数据的内部结构,分析过程都是线性过程,分析结果都是对原有数据主要特征的概括,两者之间有没有一定关系呢?本文首先通过对一组实际数据的分析,然后从理论上对两者的关系进行探讨.2数据计算分析图1中散点(以”了表示)为一组实际的气象二维变量数据[’].从几何上看,对其主成分分析相当于对原有坐标轴进行旋转,即原有的变量进行线性变换,使变换后的某一变量的方差达到最大,称其为第一主成分(或第一主分量),另外一个称为第二主成分,设旋转后的第一主成分为:x‘=eos(a)x+sin(a),(1)宾中a为旋转角,不失一般性,假定其在0、7T.记第一主成分的方差为Ql,可以表示为:其中分为x’的平均值.Q,一王资(...&
(本文共5页)
权威出处:
自科研领域开始量化研究以来,回归分析方法倍受广大研究工作者喜爱。与同类方法相比,回归分析无论在理论上还是应用上都研究得较为成熟,因而具有较高的稳定性和可推广性[1]。然而,在体育科研领域,回归分析应用的效果不尽人意。笔者查阅了自1995年以来在正式体育刊物中所发表的成果,发现存在两类问题:1是针对多元研究对象,却用简单的一元回归分析代替多元回归分析,这样做势必掩盖了问题背后的真像,揭示不出真正的、潜在的规律,甚至得出错误的结论;2是对多元回归分析中自变量与因变量间关系认识不清。其结果会导致所建立的回归方程效果差,应用范围窄,甚至会出现无法解释的方程表达式。本文以回归分析的实质为中心,结合具体的例子,分析不同研究目的下,多元线性模型对变量关系的内在要求,并针对应用多元回归分析在体育科研中存在问题进行探讨。l回归模型的基本思想和实质通常多元线性同归模型[2]可以表示如下:Y=β0+β1X1+β2X2+L+βp Xp+ε其中,β0,β...&
(本文共3页)
权威出处:
扩展阅读:
CNKI手机学问
有学问,才够权威!
xuewen.cnki.net
出版:《中国学术期刊(光盘版)》电子杂志社有限公司
地址:北京清华大学 84-48信箱 大众知识服务
京ICP证040431号&
服务咨询:400-810--9993
订购咨询:400-819-9993
传真:010-多变量分析_百度百科
清除历史记录关闭
声明:百科词条人人可编辑,词条创建和修改均免费,绝不存在官方及代理商付费代编,请勿上当受骗。
多变量分析
多变量分析(multivariable analysis)为的一种,包含了许多的方法,最基本的为单变量,再延伸出来的多变量分析。统计资料中有多个变量(或称因素、指标)同时存在时的统计分析,是统计学的重要分支,是单变量统计的发展。统计学中的多变量统计分析起源于医学和心理学。1930年代它在理论上发展很快,但由于计算复杂,实际应用很少。1970年代以来由于计算机的蓬勃发展和普及,多变量统计分析已渗入到几乎所有的学科。到80年代后期,计算机软件包已很普遍,使用也方便,因此多变量分析方法也更为普及。
多变量分析基本简介
多变量分析为的一种,包含了许多的方法,最基本的为单变量,再延伸出来的多变量分析。统计资料中有多个变量(或称因素、指标)同时存在时的统计分析,是统计学的重要分支,是单变量统计的发展。统计学中的多变量统计分析起源于医学和心理学。
多变量分析主要内容
在社会及行为科学的研究中,随着研究方法的复杂及个人计算机的普及,应用多元统计方法来分析资料的机会也相对增加。特别是近年来,各大学研究生人数逐年增加,基于学位论文撰写的需要,多元统计方法及统计软件包的运用成为不可或缺的能力。
第 一 章 多元回归分析
第 二 章 典型相关分析
第 三 章 区别分析
第 四 章 平均数之假设考验
第 五 章 多变量变异数分析
第 六 章 主成分分析
第 七 章 因子分析
第 八 章 集群分析
第 九 章 多元尺度法
第 十 章 结构方程模式
第十一章 阶层线性模式
多变量分析统计分析
(multivariable statistical analysis)
例如对630名炊事员高血压病进行调查,检查项目中除血压外,尚有年龄、性别、体重、体胖等15个项目(变量)。如果用单变量统计分析法考察超重与血压的关系,一般是把数据做成表1的形式。从表1可见,超重组与不超重组相比,高血压患病率高出一倍以上。但如果把资料按体胖者与不体胖者划分成两组,再考察每组内的超重与高血压患病率的关系,就未能发现超重与高血压患病率有任何明显的联系。也就是说,忽视了另外因素(如此例中的体胖及年龄等)的影响。对于有多个变量客观存在而又相互影响的资料,采用简单的单变量统计分析是不合理的。多变量统计分析就能把变量间的内在联系和相互影响考虑在内。
多变量统计的理论基础和工具是数学中的和。但对于实际应用者而言,只要有合适的计算机和软件包以及掌握一些初步的多变量统计知识就可以使用它来解决实际问题。多变量统计的内容很多,但从实际应用角度看,主要包括回归分析、、、、、生存分析等六个大的分支。
多变量分析回归分析
当多个变量x1,x2,…,xm(称为回归变量或自变量、独立变量)同时影响某个指标 y(称为因变量或依赖变量)时,可进行回归分析,回归分析的第一个任务就是求回归变量对指标 y的影响的统计规律性(也称回归关系);第二个任务是寻找众多的回归变量中哪一些能对指标 y产生影响(常称为因素分析或变量的筛选);第三个任务(也称相关分析)是在固定(或称消除)其他变量的影响后,考察每一个回归变量对指标 y的相关程度(称为偏相关系数)。上述三个任务常是相互联系,可以同时完成。
回归变量x1,x2,…,xm与y之间最常见的统计关系有两大类型:线性模型和。线性模型中假定y 的主要部分(记为),可由x1,x2,xm为
其中b0,b1,b2,…,bm是未知常数,需用样本去估计,ε 是用取代y后的误差。这是最常用的模型,称为多重线性回归或。用样本估计模型中未知常数的方法也很多,经典的方法为,它的理论较为完善,此法较适用于回归变量之间的相关性不很大时。其他求未知常数b0,b1,b2,…,bm的方法还有、特征根回归、主成分回归等,它们常用于回归变量之间相关性很大时。
模型中y的主要部分与x1,x2,…,xm的关系为:
其中┃ 的形式已知,未知常数 α1,α2;…用样本去估计。医学中最常见的非线性回归是,它常用于疾病对照研究以及生长发育问题中。
在前述的炊事员高血压病调查中,使用线性模型和最小二乘法求出未知常数,再用逐步回归选取变量,可求得15个变量中有 7个变量对炊事员舒张压有显著的影响,它们按偏相关系数大小排列为:年龄 (0.297),体胖程度 (0.253),肾炎史(0.162),性别(0.117),工作类别(0.081),高血压家族史(0.061),嗜咸程度(0.052)。从相关性大小看,体胖对舒张压的影响与年龄的影响大体相当。另外还可看出:工种,家族史和嗜咸对舒张压虽有影响,但影响甚小。
多变量分析判别分析
根据样本的某些指标来决定样本归属的类别。例如在医疗诊断中,要确定一个病人是否患有急性阑尾炎,这就是一个判别问题。为了回答这一问题往往需要对病人进行多项指标(变量)的检测,然后根据各项指标的观测值将病人归入患有急性阑尾炎或不患有急性阑尾炎的类中。判别分析通常是先确立一个,将各指标的观测值代入相应的变量,再根据某判别规则(如大于某值)作出判断、鉴别或决策。例如,为了研究亚硝酸基盐化合物与胃癌的关系,有人曾对胃癌组(记为H1)、萎缩性胃炎组(H2)、浅表性胃炎组(H3)3组病人测量以下6个指标(变量):性别(x1,男为1,女为0)、年龄(x2)、胃液中pH值(x3)、唾液中亚硝酸盐浓度(x4)、胃液中亚硝酸盐浓度(x5)、胃液中二甲基亚硝酸胺浓度 (x6)。用判别分析法,可求出6个指标(变量)在 3个疾病组中分布有显著不同的是x1,x2,x4,x6;其余两个指标在不同组中的分布大体相同。对应于每个疾病组可建立以下的判别函数:
u1=-11.48+2.68x1+0.37x2+0.04x4+0.90x6 (H1) u2=-14.06+3.79x1+0.35x2+0.50x4+1.82x6 (H2) u3=-6.36+1.84x1+0.27x2+0.34x4+0.84x6 (H3)
在判别分析时,可将测得的病例值(x1,x2,x4,x6)代入判别函数,求得一组函数值u1,u2,u3。这里的判别规则是:如果u1最大,则病例判属疾病组H1;如果u2最大,则判属H2;如果u3最大,则属H3。这样,诊断就变成了数据的处理及分析,现代化医院自动诊断的原理就基于此。通常说的把医生的经验和知识存入计算机,也就是在计算机中建立诊断的经验方式──。判别函数中变量前的系数含有重要的信息。上列中变量x3,x5前的系数都为0;x1前的3个系数(2.68,3.79,1.84)说明相对于女性(x1=0)而言,男性 (x1=1)更容易得萎缩性胃炎(3.79)或胃癌(2.68); x2前的3个系数说明相同年龄者得胃癌、萎缩性胃炎、浅表性胃炎的比为0.37:0.35:0.27;等等。
多变量分析因子分析
也称。医学、生物学及一切社会和自然现象中各变量(或事物)之间常存在有相关性或相似性。这是因为变量(或事物)之间往往存在有共性因素(称为公因子或共性因子),这些共性因子同时影响不同的变量(或事物)。因子分析的根本任务就是从众多的变量(或事物)中由表及里找出隐含于它们内部的公因子,指出公因子的主要特点,并用由实际测量到的变量(或事物)构造公因子。因子分析有R型及Q型之分,用于变量之间时称为 R型因子分析,用于事物之间时称为Q型。
以R型因子分析为例,设样本中的变量为x1,x2,…,xm,隐藏的公因子为┃1,┃2,…,┃k。这时每个变量在理论上常可写成下面的形式:
上式右边的第一部分是变量中公因子(┃1,┃2,…,┃k)起作用的部分,后一部分是与公因子无关的部分(称为独立性部分)。因子分析的根本任务就是用样本求出┃1,┃2,…,┃k及其系数{α吗},系数α吗 称为权或负荷系数,当样本是标准化数据且假定公因子之间彼此不相关时,则权α吗就是公因子┃j与变量xi间的相关系数。利用因子分析方法可以从所观测到的变量中推断出少数因子,用最少的因子来解释所观测到的变量,从而揭示事物之间内在的联系。对因子的实际解释必须结合专业知识并由实践检验。例如中国学者梁月华、孙尚拱曾用找出隐含在6个易测量的生理指标(收缩压、 舒张压、呼吸、心率、体温及唾液量)内部的公因子┃1,并用实验判定┃1可很好地代表交感神经的,最后用 ┃1 论证了中医的“寒热”其本质就是交感神经的抑制或兴奋。
 是研究如何把彼此相关的变量综合成一个(或少数几个)(或称主成分),而该综合指标应能最大程度地反映观测变量所提供的信息。如记(x1,x2,…,xm)为观测变量,欲求的综合指标Z一般可写成。
实际上Z往往只能吸收m个变量中相关最大的一部分信息(类似于中┃1),此当观测变量间彼此很少有相关性时,使用主成分分析是不合适的。如果观测变量间相关性可以分成几组而各组间又很少相关,这时不能用一个主成分综合全体变量,而应多取几个主成分。
实际使用时,由于与因子分析极为相似,所以不少统计学家常把两种分析不加区别,名称也相互套用。
主成分分析在医学研究中有很多应用,例如有人把5个易测量的老化征 (白斑、老年斑、闭目单腿直立时间、老年环、脱齿数)综合成一个指标Z,计算表明综合值Z可以吸收5个老化征全体信息中的43%,能综合地反映出形体老化的程度。
多变量分析聚类分析
也称为。经典的分类学诞生于几百年前,比如化石分类、植物标本分类等。过去的分类多依靠一些指标。如果对于所需分类的事物,不存在或难以使用特异性指标时就只能采用多变量统计分析法。把引进分类学并称之为“聚类分析”是60年代的事。此后聚类分析发展很快,并取得广泛应用,但还不大成熟。
也可分为 R型及Q型,对变量作分类称R型,对(观察单元、事物)作分类称 Q型。分类的基础是相似性或距离。如果两个变量(或样品)彼此相似或距离很近,自然就分在同一类。因此在进行聚类分析时必须先定义相似性或距离。相似性或距离的定义法种类繁多。例如,常用变量间的代表变量间的相似性,以几何中两点间的(先要去量纲)代表两个样品间的距离。然后选用分类的,对它们的分类作出判别。这些公式也是种类繁多。至今没有一种公式是最优的。实际工作者常选用多种方法试算,再结合专业知识确定分类的结果。
多变量分析生存分析
生存分析起源于。生物的生存时间除了受健康的影响外,同时还受社会因素,生活条件等影响。生存分析研究哪些因素对“寿命”有显著影响,它的风险程度如何。20世纪末生存分析已不仅用于研究人的寿命问题,还用于一切广义的“寿命”或有关“死亡”的问题,比如发动机的寿命,病人手术后的生存时间,两种的对比分析等。生存分析有多种模型,最常用的有Cox,它的特点是:m个变量联合作用的相对风险可以表示成每个变量单独作用时相对风险的乘积(故也称为模型)。另外常用的模型为可加性模型,它的特点是:m 个变量联合作用的相对风险可表示为每个变量单独作用之和。究竟应使用什么样的模型应在具体问题中结合专业知识确定。
多变量统计分析除了上述六个大的分支外,和典则也很常用。一般回归分析只能计算每一个变量(在固定其他变量时)对指标 y的直接作用大小,而通径分析可同时计算每一个变量对指标 y的间接作用(即通过与它相关的变量作用于 y)。通径分析在流行病的遗传研究中已有不少应用。典则相关分析也是回归分析的进一步发展。对每个事物同时测量多个指标(y1,y2,…)和多个自变量(x1,x2,…),分析指标的综合与自变量的综合是如何相关时多使用典则相关分析。
.百度百科.[引用日期]
.百度文库.[引用日期]
清除历史记录关闭

我要回帖

更多关于 单因素方差分析的例子 的文章

 

随机推荐