logistic回归分析模型模型和排序选择模型有什么区别

单因素和多因素Logistic回归分析有什么不同
就是说自变量间相互存在一定的共线性,所以在使用多自变量进行回归时,会自动剔除一些存在共线影响的自变量 再问: 我怀疑abc之间有共线性,那如果我要看有没有显著的共线性,是每次只引入一对相互作用的变量,如只引入a*b或者只引入b*c……作为变量,到logistic回归方程里面和其它所有因素一起分析还是一次性的引入a*b,
先做方差分析,确定印象因素对因变量的影响程度,应变量反应不敏感、和其它变量存在多重共线性的变量可以剔除.
其实校正变量的方法很简单,只要你把要校正的变量和要分析的变量共同纳入方程即可,但是最好在纳入方程前对于自变量能有一个初筛即根据资料的特点和文献复习的情况,只纳入可能有关的,对于初筛p值特别大的最好不要纳入方程以免方程出现不稳定,注意统计之前必须要考虑样本资料的特点.在具体分析中如果是验证哪几个因素多于因变量的影响是多大
危险因素的结果变成保护因素可能是你变量设置的问题,你懂logit的原理吗?变量设置反的话会相反的 再问: 这个研究过了,我的设置该是对的,我有核对过 再答: 那就是直接说保护因素呗,操作没错的话,大胆说
有这种东东么? 再问: 当然有了。。 就是不知道 才提问啊
回归方程,主要是看各个自变量的假设检验结果,和系数.两个自变量都有统计学意义,系数分别为-5.423和0.001,也就是说,随着自变量一增加一个单位,因变量要降低5.423三个单位.自变量二同理.比如我的因变量是高血压患病与否,随着自变量一得增加,患病危险降低.说明自变量一为保护因素.
电子工业出版社《PASW/SPSS Statistics中文版统计分析教程(第3版)(含CD光盘1张)》有详细介绍.
不一定!这取决于因变量的编码,情况十分复杂:假如,因变量编码为1时代表无病,2代表有病,那么偏回归系数为负就说明是保护性因素;如果编码为1时代表有病,2代表无病,那么偏回归系数为负就说明是危险因素,正好与前面的说法相反!注意,这个说法仅仅对于自变量为连续变量者(如体重、年龄、身高等)而言.因此,在spss的Logist
没有这么麻烦,很容易的:在Logistic回归主界面中同时选择月收入与受教育程度这两个变量(按住Ctrl键不放,用鼠标分别点击月收入与受教育程度),然后点击>a*b>键就可以了. 再问: 你好,此外,我还有一个问题,就是不知道该如何解释交互作用。比如:所有制与中层以上家庭地位,其中因变量为职业晋升与否(否为0,是为1)
在回归分析模型 Y=β0+β1X+ε(一元线性回归模型)中,Y是被解释变量,就称为因变量.X是解释变量,称为自变量.表示为:因变量Y随自变量X的变化而变化.协变量是指那些人为很难控制的变量,通常在回归分析中要排除这些因素对结果的影响.“选择变量”即是条件变量,并且有个条件定义按钮(rule),通过这个按钮可以给定一个条
logistic回归主要用于危险因素探索.因变量y为二分类或多分类变量,自变量既可以为分类变量,也可以为连续变量.比如,探索胃癌发生的危险因素,胃癌作为因变量,分为两类,“是”或“否”.危险因素可以有一个多多个,比如性别、年龄、幽门螺杆菌感染等.通过logistic回归就可以发现哪些因素会影响胃癌的发生.
logistic回归又称logistic回归分析,主要在流行病学中应用较多,比较常用的情形是探索某疾病的危险因素,根据危险因素预测某疾病发生的概率,等等.例如,想探讨胃癌发生的危险因素,可以选择两组人群,一组是胃癌组,一组是非胃癌组,两组人群肯定有不同的体征和生活方式等.这里的因变量就是是否胃癌,即“是”或“否”,为两
是的,不然把显著性水平从5%改为10%,这样子可能可以纳入更多的自变量
赤潮发生的原因很多,目前尚未有定论,所以以下写的要么就是普遍认可的原因,要么就是个人的见解,要么就是赤潮多发时的情况(比如说,气候条件之中的一些无风之类的)如果按你的说:气候条件:无风或微风、高温、干燥、闷热、水温较高等等生物因素:这是十分重要的一个条件,因为赤潮究其本质是赤潮生物的增殖达到了一个限度甚至是超过了这个限
如果你的分析方法是正确的话,这个结果是能够说明的变量3在该模型中是有贡献的,有意义的,而变量1并不显著,对Y影响不大.
环境原因和食物链都有关系,老虎生活的地方不想狮子生活的地方,稀疏草原中的猎物需要团结的力量,但是花豹那些为什么是独居?因为花豹,猎豹主要捕食较小的猎物,而且花豹是树上偷袭,猎豹是依靠速度.但狮子这两样都没他们好,而且他也不可能去吃小动物,胃口没那么小,而且像羚羊这种的,但只狮子恐怕追不上.狮子变成了群居,不但生活有了保
当然是C了啊 再问: 为什么啊?亲,能仔细说说吗? 再答: 先是纬度,庐山接近北纬三十度,夏季太阳直射点在北回归线附近,庐山的太阳高度达到最大,也就是最热,怎么可能避暑,所以A错。海陆因素,越往大陆里夏季越热,这是温带大陆性气候的特征,庐山不临海,所以不可能。问题问的是为什么庐山夏季不会高温,所以不可能是hi因为海陆因
In today's society is becoming increasingly fierce competition between enterprises,various industries involved in more and more problems,and environment factors
亚洲的季风气候主要是受巨大的海陆热力性质影响、地形因素影响(如孟加拉湾的水汽通道)以及西太平洋副热带高压纬度位置的影响(副高纬度偏北盛夏北方易涝,南方地区易旱.反之副高纬度偏南,则会造成北旱南涝的局面). 再问: 洋流因素是什么、
是正确的v影响气候的主要因素有哪些?纬度位置、大气环流、海陆分布、洋流和地形是影响气候的主要因素.前二者是全球性的地带性因素,后三者是非地带性因素.纬度位置是影响气候的基本因素.因地球是个很大的球体,纬度不同的地方,太阳照射的角度就不一样,有的地方直射,有的地方斜射,有的地方整天或几个月受不到阳光的照射.因此,各地方的关注今日:10 | 主题:194140
微信扫一扫
有序多分类Logistic回归分析怎样筛选自变量呢?
页码直达:
正在撰写的文章以并发症的分级作为因变量,分别设0(无并发症),1(轻度并发症)和2(重度并发症)3个等级,自变量包括年龄、性别、手术入路等。也查阅了很多书籍,大多虽详细说明了二元回归和多元回归筛查自变量的方法,但有序回归章节并没有相应的内容,SPSS中有序回归界面也没有向前和向后等进入方法的选择。想请教诸位师长,是否要在SPSS中有序回归界面将自变量一个个选入,分别进行回归,再将有意义的纳入最终方程呢?
不知道邀请谁?试试他们
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
关注下面公众号,回复cox回归,详细看里面在哪弄你说的这个向前向后法,你就明白啦,logistic回归是低端cox回归,你懂得~顺便转发下我的内容啊
求转发一下,也不费事,我帮你解决问题,你帮我转发几条到微信朋友圈。谢谢啦
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
有序Logistic回归不必选变量进入方法,二分类的需要选。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
木夕木依 有序Logistic回归不必选变量进入方法,二分类的需要选。那就是所有变量都纳入吗?接下来又怎么分析了,有详细图解更好,谢谢你。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
关于丁香园logistic回归分析
SPSS的logistic回归分析中因变量、协变量及选择变量是什么意思?
答:在回归分析模型
Y=β0+β1X+ε(一元线性回归模型)中,Y是被解释变量,就称为因变量。X是解释变量,称为自变量。表示为:因变量Y随自变量X的变化而变化。协变量是指那些人为很难控制的变量,通常在回归分析中要排除这些因素对结果的影响。“选择变量”即是条件变量,并且有个条件定义按钮(rule),通过这个按钮可以给定一个条件,只有变量值满足这个条件的样本数据才参与回归分析。
做logistic 回归分析,用enter, foward, backword不同方法,结果为何不同?
答:当前进法和后退法给出的答案相同,这是模型稳健的一种象征,但并不总是这样。前进法和后退法无需得到相同回答的理由是特定变量的重要性常常取决于变量选择时模型中有哪些其他的变量。某一变量当另一变量(或一组变量)处在模型中时是重要的,而当这一变量(或一组变量)不在模型中时,它却不显著了。这称为抑制效应。
几种变量的选择技术的比较:
前进法:把变量逐次引入模型中。用已经在模型中的变量进行调整后的变量和结果变量间的相关程度决定引入的顺序(相关性最强的变量最先引入),最适于涉及样本含量小的研究。不能很好的解决抑制效应。
后退法:从模型中逐次剔除变量。用已经在模型中的变量进行调整后的变量和结果变量间的相关程度决定剔除的顺序(相关性最弱的变量最先剔除)。评价抑制效应比前进法好。
3、& 最优子集法:选择使某一特定参数达到最大的变量子集,但计算困难。
全变量法(全部变量):同时引入所有的变量。如果自变量多、样本含量小或缺失数据多,把所有变量都包括进来可能会出问题。
二分类 logistic回归中“变量选择方法”有7种,以下是spss手册中的介绍。Logistic
回归:变量选择方法:
方法选择允许您指定自变量将如何进入到分析中。通过使用不同的方法,您可以从相同的变量组构造多个回归模型。
- Enter.一种变量选择过程,其中一个块中的所有变量在一个步骤中输入。
- 向前选择(条件).
逐步选择方法,其中进入检验是基于得分统计量的显著性,移去检验是基于在条件参数估计基础上的似然比统计的概率。
- 向前选择(似然比).
逐步选择方法,其中进入检验是基于得分统计量的显著性,移去检验是基于在最大局部似然估计的似然比统计的概率。
-& 向前选择 (Wald). 逐步选择方法,其中进入检验是基于得分统计量的显著性,移去检验是基于
Wald 统计的概率。
- 向后去除(条件). 逐步向后选择。移去检验基于在条件参数估计的似然比统计量的概率。
- 向后去除(似然比). 逐步向后选择。移去检验基于在最大偏似然估计基础上的似然比统计量的概率。
- 向后去除(Wald). 逐步向后选择。移去检验基于 Wald 统计量的概率。
一般来说,backward更准确一些,后退法优于前进。但是变量太多,会很慢。
stepwise用的最广泛,但也有人说慎用逐步回归的方法。
总之,选哪种都行,选择拟合最好的就可以了。大致来说,就是决定系数R2最大的就是。
▲参考Logistic回归ppt:
SPSS操作二元logistic回归方法:
选择拟合最好的方法就可以了。大致来说,就是决定系数R2最大的就是。
“方法”一般选向后(条件&似然比-LR&Wald)、然后全部进入、最后选向前。
向后速度条件向后LR,结果相似。
“分类”与“保存”不变(保持默认),“选项”点exp(B)和“在每个步骤中”。
常数值(B)& 标准误(S.E.)&
卡方值(Wald)& 自由度(df)&
P值(Sig.)&&
OR值Exp(B)& 常数(Constant)
取方程中的变量最后一步。向后LR较好。RR&1及B为负值时为保护性因素,P&0.05有统计学差异,Exp(B)(50%)间与lower(25%)和uper(75%)值之间。
B:回归系数和截距、系数值、常数项,可以是负数,负相关时出现负值;
OR:比数比(odds ratio),取值范围0至正无穷,不可能是负数;
Wald:是一个卡方值,等于B除以它的标准误(S.E.)的平方,因此也不可能是负数。Wald用于对B值进行检验,考察B值是否等于0。若B值等于0,其对应的OR为1,表明两组没有显著差异。OR等于B值的反自然对数。Wald值越大,B值越不可能等于0。
二分类 logistic回归中“变量选择方法”有7种,可以从相同的变量组构造多个回归模型:
SPSS这一回归中的Forward筛选自变量的方法实际上与我们通常所说的逐步回归法类似,即既含有变量的进入,也含有变量的剔除过程。这7种方法的进入检验都是基于得分统计量的显著性,移去检验基于基于不同剔除依据。输出中的显著性值基于与单个模型的拟合。因此,当使用逐步方法时,显著性值通常无效。所有被选自变量应被添加到单个回归模型中。不过,可以为不同的变量子集指定不同的进入方法。
Enter. 全部进入;向前选择(条件);向前选择(似然比);向前选择 (Wald)。
向后去除(条件); 向后去除(似然比);向后去除(Wald)。
Conditional和LR在变量剔除检验时都采用的是似然比检验统计量,但是在构造似然比中的似然函数最大值时,所采取的参数估计方法不同,Conditional采取的是条件参数估计,而LR采取的则是最大偏似然估计。但是关于这两个估计的区别则较少见到解释。个人认为,二者的差别并不大,实际选用时可以选择其一即可。但要注意,有时候二者给出的选择结果会有所不同,这是所有逐步回归方法所面临的一个通病,没有解药。来源
Unadjusted OR is a simple ratio of probabilities of outcome in two
Adjusted OR can be derived from the results of logistic regression
(as opposed to counting a simple ratio calculated by hand from a $2
\times 2$ table). However, in logistic regression you can include
other, confounding variables so to control their influence on your
dependent variable and if you do so, what you can get is OR that is
adjusted for the influence of confounders (see also&). So you adjust by controlling additional
variables in logistic regression model.
Originate from:
我的更多文章:
( 10:18:57)( 11:12:51)( 09:12:35)( 16:35:10)( 10:31:15)( 16:38:51)( 16:37:52)( 12:32:34)( 15:42:24)( 16:39:59)
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

我要回帖

更多关于 多元logistic回归模型 的文章

 

随机推荐