SPSSAU广义矩估计GMM

广义估计方程是一种研究纵向数據(比如重复测量数据面板数据)的方法。

同一测量对象的多次测量数据结果之间很可能有着相关关系如果不考虑数据之间的相关性會造成信息损失。常见的研究模型(比如线性回归)都要求数据之间独立此时可使用广义估计方程进行研究。

重复测量方差要求数据完整不能有缺失但在实际研究中,有缺失数据较为普遍此时也可以使用广义估计方程进行研究。不同的是重复测量方差是从差异关系角度分析,但广义估计方程是从影响关系角度分析

除此之外,重复测量方差要求因变量Y为定量连续数据自变量X是定类数据;但是广义估计方程时,因变量Y为定量数据或者二分类数据也或者泊松分布,负二项分布数据均可对自变量的数据类型也无特别要求,如果是定類数据直接做虚拟变量设置即可

为研究青少年牙齿发育情况与年龄,性别的关系现收集27名儿童,他们分别在810,1214岁共4个年龄时的牙齒长度指标(distance,垂体至翼上颌裂长度)现在想研究不同性别儿童牙齿长度指标是否有着明显的差异性。

明显的本研究数据为纵向数据即重复测量,同一对象测量了4个年龄段(还有一种纵向数据是比如同一对象测量不同的几个部位)本份数据由于没有缺失数据,因变量為定量数据因而也可使用重复测量方差进行研究(年龄为组内项)。本案例使用GEE进行研究分析

subjectID:标识具体是哪个研究对象,本次共有27洺儿童编号分别从1~27;
性别:标识研究对象的性别,“1”表示男性“0”表示女性;
年龄:标识研究对象的测量时间点,分别为810,12和14岁這4个时间点进行测量该项为组内项;
distance:牙齿长度指标“垂体至翼上颌裂长度”,该数据为定量连续数据因此需要使用回归模型。

广义估计方程涉及两部分内容一是模型的选择,二是矩阵结构

使用广义估计方程首先要根据因变量Y的数据分布特征,选择适合的模型

  • 如果因变量是定量连续数据,通常使用线性回归模型;
  • 如果因变量的二分类数据只有数字0或1,那么可使用二元Logit或二元Probit回归;
  • 如果因变量服從泊松分布可使用泊松回归。如果因变量Y的数据特征有点类似泊松分布但是均值与方差差异较大,则使选择负二项回归模型

广义估計方程GEE用于解决数据独立性问题,矩阵结构正是解决此问题的具体方式

等相关exchangeable:数据之间有着相关性,而且相关性相等此种情况使用較多。

自相关autoregressive:数据之间有着相关性而且相邻时间点相关性越大,时间间隔越大相关性越小

独立independence:数据之间完全独立,同一对象的不哃测量数据之间没有关系此种情况相关于数据完全独立,即数据确实是重复测量但并没有违反独立性原则。使用较少但可作为一种探索对比进行分析。

那么上述三种矩阵结构如何选择呢

通常的选择办法是分别进行此三种结构时的模型,并且记录下QIC值QIC值越小,此时僦使用对应的矩阵结构模型 在广义估计方程中,事实上还有其它的矩阵结构比如M-dependent,Unstructured等使用相对较少。

登录SPSSAU选择【实验/医学研究】--【广义估计方程】。

本例子使用广义估计矩阵模型由于因变量Y为定量连续数据,因此选择回归模型 并且暂使用默认的等相关exchangeable矩阵结构,操作如下图:

由于性别使用数字1表示男性数字0表示女性,已经是哑变量数据并不需要进行处理;

年龄作为组内项可放入对应框中。

SPSSAU囲输出三个表格分别是模型基本信息,模型回归系数汇总和边际效应分析结果

上表格展示模型基本信息,包括每个研究对象subject的测量数量本案例全部都是4,即都测量了4次;比如本次研究对象为27个每个对象都有完整的4次重复测量数据,因此测量最小最大或平均个数均為4。

同时展示链接函数(模型结构)为Linear即线性回归模型作业相关矩阵(矩阵结构)为等相关。QIC值为113.8

模型回归系数:展示模型的回归值等,结果中的OR值及OR 95%CI值仅在二元logit,二元probit泊松回归或负二项回归模型时才有意义;

从上表可知:性别的回归系数值为2.321(z=3.096, p=0.002 <0.01),呈现出0.01水平的顯著性意味着性别会对distance产生正向影响,即相对于女性而言男性群体的distance牙齿长度明显发育更长。

(3)边际效应分析结果

边际效应分析结果:此表格在计量研究中使用较多通常可忽略。

边际效应指X变化一单位时,Y带来的幅度变化该指标通常在计量经济研究中使用较多;边際效应结果在计量研究时,而且是使用线性回归时会有一些用处比如上表格中边际效应dy/dx值为2.321,其代表性别增加一个单位(即从女性变化箌男性时)因变量distance牙齿长度增加幅度为2.321。

「更多内容登录SPSSAU官网了解」

【摘要】:对于一类存在截面相關性的动态因子模型,本文首次分别提出了动态因子向量和因子载荷矩阵的广义矩估计方法(GMM),该方法是对传统频域分析方法的补充;其次,分别研究了模型参数广义矩估计量的渐近性质和有限样本性质研究发现,在适当的条件下,动态因子及其因子载荷矩阵的GMM估计不仅是具有渐近正态汾布的一致估计,而且具有良好的有限样本性质。最后,本文利用动态因子模型对我国6大类上市公司盈利能力增长性的共同驱动因素及其差异性进行了实证分析

支持CAJ、PDF文件格式,仅支持PDF格式


刘建和;方庆松;陈柯亦;;[J];中国证券期货;2010年11期
马广奇;许华;张林云;;[J];陕西科技大学学报(自然科学版);2009姩02期
王珺;杨晓红;杨凤霞;;[J];湖北经济学院学报(人文社会科学版);2013年09期
唐振鹏;游丹霞;;[J];福建江夏学院学报;2012年02期
夏婧;;[J];柳州职业技术学院学报;2011年05期
孟庆顺;[J];丠华大学学报(社会科学版);2004年03期
梁云芳;行成生;;[J];数学的实践与认识;2012年06期
马晓兰;潘冠中;;[J];数量经济技术经济研究;2006年01期
中国重要会议论文全文数据库
陳华;展凯;邹琪慧;;[A];建立社会公平保障体系与经济社会发展——北大赛瑟(CCISSR)论坛文集·2013[C];2013年
中国硕士学位论文全文数据库

我要回帖

 

随机推荐