spss中设置虚拟变量的具体过程
设置虛拟变量我是会做的但是这里会有新问题。当使用spss软件做多元spss线性回归如何控制变量归分析时会纳入多个自变量,假如有5个自变量其中一个是血型,其他自变量都是连续变量那么设置自变量时,血型共有三个虚拟变量加上其他四个,共有7个自变量需要纳入到回归方程中请问这样做对吗?有的书上提到血型的三个虚拟变量需要同时进同时出,如何办到如果我以血型A为参照,是否就是说血型A鈈设置虚拟变量而以其它三个血型设置三个虚拟变量,那么这样做以后,如果血型B的OR值为1.2可以这样解释,即血型B的患者比血型A的患者患所研究疾病的可能性大20%
問題1:那么设置自变量时,血型共有三个虚拟变量加上其他四个,共有7个自变量需要纳入到回归方程中请問这样做对吗?
沒錯迴歸方程式是這樣的
問題2:有的书上提到,血型的三个虚拟变量需要同时进同时出如何办到?
如果讲的设置虚拟變量我是会做的那麼你只要接著執行步驟3到步驟6
步驟1:輸入資料。類別資料以原始型態輸入
步驟2:虛擬化處理類別變項:
舊值與新值→指令設定新變項的轉換條件,總共要做K-1次(你要做3次)
spss虚拟变量设置步驟3:選取統計→分析迴歸方法→線性
spss虚拟变量设置步驟4:選擇依變項
spss虚拟变量设置步驟6:選擇強迫進入變數法,按確定執行
spss虚拟变量设置問題3:如果我以血型A为参照,是否就是说血型A不设置虚拟變量而以其它三个血型设置三个虚拟变量,那么这样做以后,如果血型B的OR值为1.2可以这样解释,即血型B的患者比血型A的患者患所研究疾疒的可能性大20%
『血型A不设置虚拟变量』??
『如果我以血型A为参照』,按照邱皓政(2007)的作法改寫如下;
如果間斷變項有K個水準,則需要K-1個虛擬變項【此例為5-1=4】
0 | 0 | 0 |
0 | 0 | 0 |
0 | 0 | |
0 | 0 | |
0 | 0 | |
0 | 0 | |
0 | 0 | |
0 | 0 |
Type1表示『血型B組與血型A組的對比』
Type2表示『血型O組與血型A組的對比』
Type 3表示『血型AB組與血型A組的對比』
至於血型A組扮演參照組的角色
當你按照問題2所描述的步驟3到步驟6執行完畢之後從SPSS提供的結果中:
血型B組與血型A組的對比
血型O組與血型A組的對比
血型AB組與血型A組的對比
會有分別對應的標準化Beta係數以及t值以及p值。
Beta係數的正負值會說明各血型組與A血型的差異
例如Beta—BA為正則顯示就因變數洏言,B血型高於A血型B
SPSS的多元回归并不是一次把所有变量全进入方程,本质上是逐一分析的另外,直接做spss线性回归如何控制变量归的话我认为不甚合理,应先做散点图拟合回归采用Lowess
线选项对所有数据进行整体拟合,即局部加权回归散点图修匀法以减少主观倾向,拟匼结果表现出良好的线性关系后才开始做回归分析。
想补充以下内容. 对于logistic回归模型中的多分类自变量,需要虚拟变量(哑变量)来分析,以期对結果有更正确合理的解释. 在以前的软件中,需要用楼上的方法, 由一个分类变量, 生成多个变量进行分析(变量数为分类数减去1). 若进行多个多分类變量分析, 很浪费时间.
显示可选last或first. 如选first, click “continue”即可. 此时, 已将多分类变量设置为虚拟变量, 且以第一个分类为参照(如第一年龄组), 若选last, 则以最后的分類为参照(如最后年龄组). 然后进行分析即可. 若有多个多分类变量, 可采用同样的方法进行设置.