如何转换成xsmle命令可以python调用linux命令的空间权重矩阵

苹果/安卓/wp
积分 1658, 距离下一级还需 567 积分
权限: 自定义头衔, 签名中使用图片, 隐身, 设置帖子权限
道具: 涂鸦板, 彩虹炫, 雷达卡, 热点灯, 显身卡, 匿名卡, 金钱卡, 抢沙发, 变色卡, 提升卡下一级可获得
权限: 设置回复可见道具: 沉默卡
购买后可立即获得
权限: 隐身
道具: 金钱卡, 变色卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
TA的文库&&
开心签到天数: 131 天连续签到: 1 天[LV.7]常住居民III
由于spmat命令生成的spmat文件无法查看,故不知道xsmle命令引用的空间权重矩阵形式,请问各位大牛三个问题,1、如何查看spmat文件里的空间权重矩阵,2、附件中横截面空间权重矩阵dta文件如何转换成能够被xsmle命令使用的空间权重矩阵?3、如何像图片中那样进行命令结果对比。。附上案例.dta文件和权重文件,望能用xsmle命令进行空间面板固定效应计算过程附上,拜谢。
13:12:46 上传
13:14:46 上传
13:14:45 上传
楼主你好!我在用spmat命令生成spmat文件时也遇到了同样的问题,请问你的问题解决了吗?
运行了你的两个文件,是可以的。
1、spmat dta spwxt v1 v2 v3 v4 v5 v6 v7, normalize(row)
2、spmat save spwxt using spwxt.spmat
3、spmat use sspwxt using &spwxt.spmat&
4、use &C:\Documents and Settings\Administrator\桌面\xsmle.dta&, clear
5、xtset id t
6、xsmle y x1, wmat(spwxt) fe
就可以搞定了。另外,想问你一下,你的spwxt.dta和xsmle.dta是如何生成的?
drj1211 发表于
运行了你的两个文件,是可以的。
1、spmat dta spwxt v1 v2 v3 v4 v5 v6 v7, normalize(row)
2、spmat sa ...xsmle是在excel中做好,然后导入到stata的,spwxt使用GEODA生成空间权重矩阵再一个个对应设置空间权重,或者直接在地图上一个个去找就好了。其他的方法暂时不知,已经毕业了,一年多没搞了
请问,权重中的变量名要与回归中的地区名一致吗?
我姓王 发表于
请问,权重中的变量名要与回归中的地区名一致吗?ID设置一致就好
<font color="#2897834 发表于
ID设置一致就好比如权重中,我把北京作为第一个,那么我在数据中形成新的变量例如state,在其中将北京定义为1,这样的软件就对应起来了是不是呢?
drj1211 发表于
运行了你的两个文件,是可以的。
1、spmat dta spwxt v1 v2 v3 v4 v5 v6 v7, normalize(row)
2、spmat sa ...谢谢你,解决了大问题,想给你加分,但是不知道到怎么弄。。。
宏尘 发表于
谢谢你,解决了大问题,想给你加分,但是不知道到怎么弄。。。哈哈,搞好就好,分数没意义,工作好久了
drj1211 发表于
运行了你的两个文件,是可以的。
1、spmat dta spwxt v1 v2 v3 v4 v5 v6 v7, normalize(row)
2、spmat sa ...您好,我想问一下是不是在第一条命令运行时不标准化就不能进行最后的运算?
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向,请联系(010-);
邮箱:service@pinggu.org
投诉或不良信息处理:(010-)
论坛法律顾问:王进律师在计量实证中常见操作问题小结,计量经济圈专刊
用微信扫描二维码分享至好友和朋友圈
用微信扫描二维码分享至好友和朋友圈
  文末有计量经济圈的重大资料福利。  引语:下面是关于计量经济学在具体操作中遇到的一些问题,以及他们的相关解答思路。计量经济学已经发展到了较为成熟阶段,但计量经济圈认为,理论计量需要在实证计量之前进行,否则我们就会失去一个分析框架。1.Zellner-SUR与One step-SGMM方法,用Zellner-SUR方法的原因是什么?  答:SUR, 全称为Seemingly Unrelated Regression,是一个系列回归方程组,因为看起来这些回归方程之间没有关系,但他们的估计余项error term实际上是相关的。因此,我们需要分布求出各个余项,然后通过Variance-Covariance 矩阵来消除这中间的余项相关性,最终获得的估计才会更加有效。  2.求助:做完误差修正模型VECM后,想进行格兰杰因果检验用什么命令?stata里面貌似只有做完VAR时可以使用的vargranger这个命令?是否可以用gcause这个命令对变量进行两两检验?  答:Vecm与var实质上类似的,只不过vecm把不平稳的变量进行协整后,进行了Var款式的回归,最后出现了长短期之分。  所以,你如果想检验一次差分后的vecm的因果关系,你就按照var的路子塞进去差分过后的变量和之前通过ols回归过后留下的那个error term,这样vecm就相当于var,然后你就可以进行multivariate Granger causality检验基于Var。  就是说,把差分后的变量强制用var做一遍,然后用vargranger ,得出得格兰杰因果关系就是vecm的格兰杰因果关系。  3.下面的回归就是关键的解释变量不显著,我不知道怎么调整了?  Oneway (individual) effect Two steps model  Call:  pgmm(formula = y22 ~ lag(y22, 1) + lag(x11, 0) + lag(x12, 0) + lag(x21, 0:1) + lag(x22, 0) + lag(x23, 0) + lag(x24, 0) + lag(x31, 0) | lag(y22, 2:5), data = dd, effect = "individual", model = "twosteps", transformation = "ld")  Unbalanced Panel: n=32, T=1-8, N=248  CoefficientsEstimate Std. Error z-value Pr(&|z|)  lag(y22, 1) 0...e-15 ***  lag(x11, 0) -0...  lag(x12, 0) -0...88  lag(x21, 0:1)0 0...3483 & 2.2e-16 ***  lag(x21, 0:1)1 -0...e-11 ***  lag(x22, 0) 0...75 *  lag(x23, 0) 0...88  lag(x24, 0) -0...06 *  lag(x31, 0) -0...40 ---  Signif. codes: 0 &***& 0.001 &**& 0.01 &*& 0.05 &.& 0.1 & & 1  Sargan Test:p.value=0.68144  Autocorrelation test (1): p.value=0.0012981  Autocorrelation test (2): p.value=0.50829  Wald test for coefficients: p.value=& 2.22e-16  答:你用动态panel,或用random effect,试试。  4.Mean Groups (MG), Demeaned MG (DMG) and Common Corrleated Effects MG (CCEMG) estimators for heterogeneous panel models  答:对于mean groups主要用来解决fixed or random effects估计中设定的slope相同可能导致的不连贯性问题,所以mean group直接允许intercepts,slope,error等都可以在cross section间不同,这样估计出来的结果更连贯。  对于ccemg,主要是解决大panel data时,cross section彼此依赖的问题,也就是说,自变量和因变量都受到一个共同的但不可观测的因素影响,也允许slope不同,还可以延展到动态的panel data,平时用的工具变量和gmm解决动态panel data主要用于那些小面板数据。  5.面板回归空间误差的的三个检验的命令是啥?截面数据的命令是 spatdiag,面板数据咋检验?就是要检验面板数据有没有空间效应。这个面板空间交互性检验是用的什么命令? 陈强老师的书里面只有截面的命令spatdiag,w(w),w是空间权重矩阵。    答:Spatial interactions panel data,我建议用这个命令"xsmle"。你当回归出来后,直接、间接、总的效应比较直观也知道显著性,还可以做postestimation。那个xsmle命令中应该有option (mi),你就可以用来处理unbalanced spatial panel。  6.有同学知道怎样画矢量图,用什么软件最方便么?    答:Coreldraw,当然也可以用adobe illustrator。  7.近来学习发现VAR正交化之后的脉冲响应函数(如乔利斯基分解之后的),是不是与SVAR的脉冲响应函数是一致的。感觉两者都用到了下三角矩阵的假设和相应的分解。  答:VAR带着choleski分解实际上等于svar的一种特例。Svar可以通过有不同的imposition而取得不一样的impulse response function。还有短期,长期之分,有just identified和over identified之分。  8.我想在相关性分析中标出3颗星星,怎么做?  答:要标星,用这个esttab  9.在哪里有faraway程序包?  答:去这个网址获得此包,  https://cran.r-project.org/web/packages/faraway/index.html  10.面板数据中有个变量不显著,但是删除了会影响其他变量显著性,那么这个变量就还是带着吗?各种效应这个变量都不显著。  答:不删可以,毕竟你不用这个变量解释东西。那可能这个控制变量和其他变量之间有比较严重的共线性。  11.对数据做回归,用两种不同的方程拟合,一个得到的残差比较小,一个比较均匀,哪个比较好呢?      答:检查一下residual的自相关,residual与y的关系,residual 的concentration程度围绕0,等等。残差得符合normal distribution。  12.我用stata 做heckman两步,第二步还是probit,输入heckprob之后,出现了o 的结果。我因变量都是0.1的啊?想请教一下错在哪里了?    答:注意Selection equation和Outcome equation的回归变量需要满足一些条件(Selection equation需要有一个回归变量没有在Outcome equation中出现过),还有保证两个Equations的被解释变量顺序正确。  13.想问一下,如果控制变量不显著该怎么解释呢?如何处理呢?  答:那证明,那个控制变量可能不影响你的解释变量与被解释变量之间的关系了。控制变量加入是为了检测其他变量的关系,当然你的情况可能这样的,你的主要解释变量可能因为控制变量对你的被解释变量影响力度超大而让你的所预想主要解释变量系数不明显。你确实需要检测一下你的控制变量与解释变量直接的相关性。  14.我想问下,在用stata做回归时,语句里面怎么区分是控制变量还是主要变量?还是语句里面不用区分,都放入回归模型中就行?  答:全部都放入,只是你在论文中分析时怎么表达而已。你看那些论文的模型主要变量后面都会跟一个控制变量集。  15. 请教一个问题,在回归中,某个控制变量取对数与不取对数,对其他变量的估计结果有很大影响,想不通这是什么原因(自变量的相关系数都不大)。  答:取对数主要是考虑强制缩小outlier,还有就是靠近normality,你这个数据没有skeness 和kurtosis biasness,检查一下这个。  16.请教一个问题,面板数据变量y和x的相关系数不高,散点图也观察不出明显的关系,但是在控制个体和时间效应后,回归系数很显著,这种回归分析有问题吗?在回归前一定要先判断变量间的相关性吗?  答:对于Panel data,我们总是想要解决Unobserved heterogeneity,这些存在于个体或时间段上的差异性,将会因为我们的忽略而导致“Omitted variable bias”(考虑下Confounding variable)。而要解决这个问题,我们的方法fixed effect(控制个体间的差异性)和 between effect(控制时间段的差异性)。  而如果你在还没有控制个体和时间效应之前,发现regressors和regressed之间相关性不高;可当你在控制了两个效应后(即在回归方程中加入了个体和时间效应),却发现regressors和regressed之间相关性很大(回归系数很显著),这就明明显示了你差点犯了“Omitted variable bias”的问题,因此你应当使用Panel data的固定效应或随机效应进行回归。  17.面板数据是不是一开始就要在固定效应与随机效应中做选择?  答:实际上,固定效应回归总能够保证Consistency,只不过不能够保证Efficiency;而随机效应回归一般而言更加有效,但是不一定那么具有Consistency。  因此,在Hausman test中,你就是通过一个Asymptotic distribution组建一个分布,来平衡Consistency和Efficiency。在面板数据中,你需要先做选择的。  18.请问能帮忙解释一下面板工具变量回归出来的这一部分命令吗?中间那一部分弱识别那一部分右侧的数据是什么意思?  答:Underidentification test 即识别不足检验 其原假设是认为存在识别不足问题 或者说是工具变量与内生变量无关,这个结果可以说明你的工具变量与内生变量相关,但仍然可能存在弱工具变量这一问题。  Weak identification test 即弱工具变量检验 这是识别不足检验的进一步检验,其原假设是认为工具变量与内生性变量有较强的相关性,你的结果说明工具变量相关性还是比较高的。那最后一行的过度识别检验:H0,过度identified,H1,不是过度identified。  19.面板平滑回归(Panel Smooth Transition Regression)?Hansen的门槛回归(非线性)?  答:下载RATS计量软件,然后用GVTD.SRC程序包。Hansen的门槛GMM回归软件包R:http://www.ssc.wisc.edu/~bhansen/progs/et_04.R。门槛回归的Stata软件包命令:threshold。  20.①pcse 模型,31省市 ,8期,是不是太短了,不能用呢 ?  agl.pcse &- pcse(agl.lm, groupN=mydata\$region, groupT=mydata\$year,pairwise=TRUE)  Error in pcse(agl.lm, groupN = mydata\$region, groupT = mydata\$year, pairwise = TRUE) :  Error! A CS-unit exists without any obs or without any obs in common with another CS-unit. You must remove that unit from the data passed to pcse().  ②请问下外标法或标准曲线怎么弄?  ③用Excel做规划求解,目标单位格里直接输入类似=x1+x2可以吗?  ④有用charls 数据的吗?请问“家庭人口数”这个怎么做?有没有知道工作经验这个变量在chns的哪个文件里面?  ⑤stata新手请教群里大神,tsset如何设置不连续的时间序列?比如非交易日的情况。    如果希望加入计量经济圈的核心圈,请(戳这里),然后留下邮箱。  计量经济圈的文末福利:  《伍德里奇计量经济学三十七讲》的视频和PPT,对于咱们想要理解计量经济学相关理论知识的,从而进入实证经济规范研究,是非常必要的学习资料。                那些有需要的圈友们,可以有以下两种选择:  “2”元(安卓和苹果圈友都可以的);下面还有一步需要完成才行,请看 "b"。  b.然后把“转账单号”里的那一连串数字(比如,下图黑线里的数字)输入到主页菜单“消息框”(这个简单吧),待计量经济圈确认后会迅速地通过这个消息框发送给你这套视频和PPT哦。    或者②发送其他计量经济资料来分享给计量经济的圈友们,即资料置换  (邮箱:),  麻烦圈友们在阅读文章后随手点击下面的广告块,这相当于你给计量经济圈打赏2-5毛钱。无论如何,计量经济圈都感激不尽。
特别声明:本文为网易自媒体平台“网易号”作者上传并发布,仅代表该作者观点。网易仅提供信息发布平台。
阅读下一篇
网易通行证/邮箱用户可以直接登录:苹果/安卓/wp
积分 1288, 距离下一级还需 87 积分
权限: 自定义头衔, 签名中使用图片, 隐身
道具: 涂鸦板, 彩虹炫, 雷达卡, 热点灯, 显身卡, 匿名卡, 金钱卡, 抢沙发下一级可获得
权限: 设置帖子权限道具: 变色卡, 提升卡
购买后可立即获得
权限: 隐身
道具: 金钱卡, 变色卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
开心签到天数: 19 天连续签到: 1 天[LV.4]偶尔看看III
本帖最后由 fei355 于
18:54 编辑
以下都用中国的例子
(一)得到数据库文件和坐标文件
1.之所以这一步是由于在实际分析中会删除个别省份,然后基于剩余省份制作shp文件后生成空间权重文件。找到中国地图省级、省会城市、城市、县的dbf和shp文件,注意:各级地图的dbf和shp文件的名称必须相同且是英文,如province.dbf和province.shp,provcap.dbf和provcap.shp等2.在stata中安装spmap、shp2dta和mif2dta命令是ssc install spmap\& &shp2dta\mif2dta
3.在指定目录下,运行命令shp2dta using ProCap, data(&ProCap_data&)&&coor(&ProCap_coordinates&),其中下划线部分分别是使用的数据库和坐标名称,转换后的数据库和坐标文件名称,然后用命令 merge ID using procap_coordinates,将文件复制到txt文档中编辑成符合geoda格式(第一行写上截面单位数和变量数,第二行是变量名称,用英文下双引号引起,用逗号隔开,剩下行是观测值也要用逗号隔开,当然可以先在excel中编辑再拷过来)然后打开geoda~tools~shape~points from ascii,主要设置位置,然后保存为shp文件,最后基于此文件生成空间权重矩阵,当然质点文件只能生成knearest和threshold distance距离权重。
(二)如果用geoda生成了权重数据,那么可以通过以下方法转换成stata文件
1.用geoda生成不同类型的权重文件,比如province_knear.gwt,打开另存为province_knear.txt
2.用记事本打开后复制出来或者在stata中输入命令insheet using province_knear.txt,删除关键词,保留位置变量和邻近数量变量,并重命名为v1和v2,并另存为spweight3.dta
3.在stata中安装spweightxt命令
<font color="#.输入命令& &
& && & clear all
& && &&&sysuse spweight3.dta, clear
& && &&&list v1 v2
& && &&&spweightxt v1 v2 , panel(34)&&time(8) matrix(W) eigw table
就可以生成中国34个省份观测单位8年的权重指标了。
注意:其中panel()项可以设置你要生成的权重观测单位数一般与原始文件一致,如果想减少几个省份,则先在原始文件减少,time()设置生成时间的维数,一般空间面板数据用的上。然后生成的权重数据分为横截面和面板类型分别保存在 Cross Section Weight Matrix File (Wcs.dta)和 Panel Weight Matrix File& & (Wxt.dta)中要查看只需输入 use Wcs.dta,clear 或者use Wxt.dta ,clear即可
(三)空间面板回归
主要说gmm估计
命令是 spgmmxt y&&x1 x2 , nc(7) wmfile(SPWxt) gmm(1) mfx(lin) test
暂时就说这么多,有空了再写详细点,主要想把在STATA中如何进行空间面板的操作写一下!
热心帮助其他会员
对论坛有贡献
热心帮助其他会员
总评分:&经验 + 180&
论坛币 + 92&
学术水平 + 23&
热心指数 + 21&
信用等级 + 17&
本帖被以下文库推荐
& |主题: 873, 订阅: 268
& |主题: 151, 订阅: 91
& |主题: 106, 订阅: 32
& |主题: 112, 订阅: 48
非常感谢楼主!期待您写出运用stata分析空间面板数据模型的详细步骤,如原始数据的导入、几类空间面板权重的生成、moran\G指数的计算,真是大功德一件了!
纵一苇之所如,凌万顷之茫然。
首先非常感谢楼主提供的宝贵经验!其次我仔细揣摩你提供的方法,有两点疑问,希望你能够帮忙解答。其一,你在第一步转换得到的数据库和坐标文件的作用是什么,或者说它与第二步的关系是什么。其二,我们知道SPWEIGHT命令的V1和V2只能是0或者1,那么请问若是构建地理距离权重矩阵或者经济距离权重矩阵,V1和V2又该如何设定呢,若是不能设定,那么如何得出面板数据的空间权重矩阵呢,这些问题一直困扰我,所以希望你能帮忙解答一下。总结来说,就是我该如何通过STATA构建地理/经济距离权重矩阵,详细步骤是什么,麻烦你了。
鼓励积极发帖讨论
总评分:&论坛币 + 10&
学术水平 + 1&
热心指数 + 2&
信用等级 + 1&
zhichi&&ge&&xiexie
寻梦?撑一支长篙,向青草更青处漫溯;满载一船星辉,在星辉斑斓里放歌。
it is goooooooooooooood
不错,期待LZ接下来的详解
楼主 我在stata中输入spweightxt v1 v2 , panel(34)&&time(5) matrix(W) ptable,得不出结果。
显示matrix __00000K11 would have missing values
楼主帮我看看。geoda生成的权重文件在附件中。谢谢!
16:57:43 上传
geoda生成的权重文件(按v1和v2整理的文件)。
17:03:51 上传
热心帮助其他会员
总评分:&论坛币 + 20&
学术水平 + 3&
谢谢好经验~!!!!!!!!!!
非常感谢您的分享,但是我想请问, spweightxt v1 v2 , panel(34)&&time(8) matrix(W) eigw table中的“ eigw table”是什么意思呢?
鼓励积极发帖讨论
总评分:&经验 + 10&
热心指数 + 1&
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向,请联系(010-);
邮箱:service@pinggu.org
投诉或不良信息处理:(010-)
论坛法律顾问:王进律师当前位置: >>
第29章空间计量经济学
? 陈强,《高级计量经济学及 Stata 应用》课件,第二版,2014 年,高等教育出版社。第 29 章 空间计量经济学29.1 地理学第一定律 许多经济数据都涉及一定的空间位置。比如,研究全国各省的 GDP、投资、贸易、R&D 等数据。 此前各章很少关注各省经济之间的互动,通常假设各省的变量 相互独立。 但各省经济有着广泛的联系,而且越近的省份联系越密切。1 根据 Tobler (1970), “所有事物都与其他事物相关联,但较近的 事物比较远的事物更关联”(Everything is related to everything else, but near things are more related than distant things)。 这被称为“地理学第一定律”(First Law of Geography)。 各省之间的距离信息并不难获得,比如是否相邻,直线距离或 运输距离。 将各省的变量数据,再加上各省的位置信息(或相互距离),即可 得到“空间数据”(spatial data 或 areal data)。 研究如何处理空间数据的计量经济学分支,称为“空间计量经 济学”(spatial econometrics)。2 空间计量经济学的最大特色在于充分考虑横截面单位之间的空 间依赖性(spatial dependence)。 空间效应(spatial effects)包括空间依赖性与 “空间异质性” (spatial heterogeneity)。 由于标准的计量经济学也考虑横截面单位之间的异质性(比如异 方差),故空间计量经济学的关注重点为空间依赖性。 空间计量经济学诞生于 1970 年代。近年来,空间计量经济学蓬 勃发展并进入主流,可归功于两方面。 首先,由于 GIS(地理信息系统)的发展,空间数据或包含地理信 息的数据(geo-referenced data)日益增多。3 其次,在经济理论方面,人们越来越关注经济行为人之间的互 动,而不仅仅停留于代表性厂商或个人。 比如,在考察同伴效应 (peer effect) ,相邻效应 (neighborhood effect),溢出效应(spillover effect)或网络效应(network effect)时,都 需要明确地考虑空间因素。 29.2 空间权重矩阵 进行空间计量分析的前提是度量区域之间的空间距离。 记来自 n 个区域的空间数据为? xi ?i ?1,下标 i 表示区域 i。记区域ni 与区域 j 之间的距离为 wij ,则可定义“空间权重矩阵”(spatial weighting matrix)如下:4 ? w11 ? w1n ? ? W ?? ? ? ? ? ? ?w ? w ? nn ? ? n1其中,主对角线上元素 w11 ? ? ? wnn ? 0 (同一区域的距离为 0)。 空间权重矩阵W 为对称矩阵。 最常用的距离函数为“相邻”(contiguity),即如果区域 i 与区域 j 有共同的边界,则 wij ? 1;反之,则 wij ? 0 。 比照(国际)象棋中棋子的行走路线,相邻关系可分为以下几种:5 (1) 车相邻(rook contiguity):两个相邻区域有共同的边。 (2) 象相邻(bishop contiguity):两个相邻区域有共同的顶点,但 没有共同的边。 (3) 后相邻(queen contiguity): 两个相邻区域有共同的边或顶点。车相邻 象相邻 后相邻图 29.1 常用相邻关系6 在实践中,为了区分“边”与“点” ,须设定一个最小距离,在 此距离以下为点,而在此距离以上为边。 究竟使用车、象或后相邻,取决于具体情况。 比如,区域 i 与区域 j 仅在一点相交(象相邻),但有一条主要高 速公路通过此点连接两区域,则不宜使用车相邻。 假设有如下四个区域,其变量取值分别为 x ? ( x1 x2 x3 x4 )? 。7 x1 x4 x3 x2图 29.2 假想的四个区域其空间权重矩阵为:?0 ?1 W ?? ?1 ? ?1 1 0 1 0 1 1 0 1 1? 0? ? 1? ? 0?第一行表示,区域 1 与其余三个区域均相邻;第二行表示,区 域 2 与区域 1、区域 3 相邻,但不与区域 4 相邻;以此类推。8 空间权重矩阵考虑的是一阶邻居,还可以考虑二阶邻居,即邻 居的邻居,可用矩阵W 2 来表示。 矩阵W 2 的主对角线上元素一般不再为 0,这意味着邻居的邻居 也包括自己。 实 践 中 , 有 时 对 空 间 权 重 矩 阵 进 行 “ 行 标 准 化 ” (row ? ij )除以其所在行元 standardization),即将矩阵中的每个元素(记为 w 素之和,以保证每行元素之和为 1:? ij w wij ? ? ij ?wj9 如果区域 i 为孤岛,与其他区域均不相邻,则上式分母为 0,并 ? ij ) 。 不适用;可将分母改为 max(1, ? wj不包含孤岛的行标准化矩阵也称为 “行随机矩阵” (row-stochastic matrix),所有元素均介于 0 与 1 之间,且每行元素之和为 1,在形 式上与离散型概率分布一样。 将前面的空间权重矩阵行标准化可得(仍记为W ):? 0 1 3 1 3 1 3? ?1 2 0 1 2 0 ? ? W ?? ?1 3 1 3 0 1 3? ? ? 1 2 0 1 2 0 ? ?10 行标准化的好处在于, 如果将行标准化矩阵W 乘以 x , 则可得到 每个区域邻居的平均值。在上例中:? 0 1 3 1 3 1 3 ? ? x1 ? ?( x2 ? x3 ? x4 ) ?1 2 0 1 2 0 ? ? x ? ? ( x ? x ) 2 1 3 ?? 2 ? ? ? Wx ? ? ? 1 3 1 3 0 1 3 ? ? x3 ? ? ( x1 ? x2 ? x4 ) ? ?? ? ? 1 2 0 1 2 0 ? ?? x4 ? ? ( x1 ? x3 ) 23? ? ? 3? ? ?比如,区域 1 的邻居为区域 2,3 和 4,而上式右边第一行元素 正好为 ( x2 ? x3 ? x4 ) 3 ,即区域 1 邻居的平均值;以此类推。11 比照时间序列中时间滞后(time lag)的概念, Wx 也被称为 x 的 “空 间滞后”(spatial lag),即 x 邻居的平均取值。 行标准化之后的空间权重矩阵一般不再是对称矩阵,这是它的 缺陷之一。 由于每行元素之和均为 1, 这意味着区域 i 所受其邻居的影响之 和一定等于区域 j 所受其邻居的影响之和(任意 i ? j ); 此假定可能 过强,这是行标准化的另一局限。 定义相邻关系的另一方法基于区域间的距离。12 记区域 i 与区域 j 的距离为 dij ,可定义空间权重如下:?1 若dij ? d wij ? ? ?0 若dij ? d其中,d 为事先给定的距离临界值。 也可直接以距离之倒数(inverse distance)作为空间权重:wij ? 1 dij13 在上式中,距离 dij 既可以是地理距离,比如直线距离或大圆距 离(great circle distance);也可以是基于运输成本或旅行时间的经 济距离;甚至社交网络中的距离。 例:林光平等(2005)使用基于地理相邻关系的简单权重矩阵W 来研究我国 28 个省市在
年期间实际人均 GDP 的收敛 情况。但相邻地区经济上的相互关系并不完全相同。 为此,林光平等(2005)使用地区间人均 GDP 的差额作为测度地 区间“经济距离”的指标,并引入经济空间权重矩阵W * ? W ? E , 其中矩阵 E 的主对角线元素均为 0 ,非主对角线的 (i, j ) 元素为 1 Eij ? ( i ? j ),Yi 为地区 i 样本期间的人均实际 GDP 平均值。 Yi ? Y j14 29.3 空间自相关 在使用空间计量方法前,首先要考察数据是否存在空间依赖性。 如果不存在,则使用标准的计量方法即可; 如果存在,则可使用空间计量方法。 比照时间序列(time series),空间数据有时也称为“空间序列” (spatial series)。 时间序列可视为在时间轴上分布的随机过程, 而空间数据(序列) 则为在空间分布的随机过程。15 时间序列的一个重要特性是可能存在自相关,特别是一阶自相 关。 对于空间序列,自相关的情形则更为复杂;因为时间序列只可 能在一个方向上相关(过去影响现在,但现在无法影响过去),而空 间序列则可以在多个方向上相关,而且可以互相影响( xi 影响 x j , 而 x j 也影响 xi )。 “空间自相关”(spatial autocorrelation)可理解为位置相近的区域 具有相似的变量取值。 如果高值与高值聚集在一起, 低值与低值聚集在一起, 则为 “正 空间自相关”(positive spatial autocorrelation)。16 如果高值与低值相邻,则为“负空间自相关”(negative spatial autocorrelation);较少见。 如果高值与低值完全随机地分布,则不存在空间自相关。 考虑空间序列? xi ?i ?1。n文献中提出了一系列度量空间自相关的方法, 最为流行的是 “莫 兰指数 I”(Moran’s I):I??? wij ( xi ? x )( x j ? x )i ?1 j ?1nnS2?? wiji ?1 j ?117nn 其中,S 2 ?2 ( x ? x ) ? i?1 i nn为样本方差,wij 为空间权重矩阵的 (i, j )n n i ?1 j ?1元素(用来度量区域 i 与区域 j 之间的距离), 而 ?? wij 为所有空间 权重之和。 如果空间权重矩阵为行标准化,则 ?? wij ? n ,莫兰指数 I 为:i ?1 j ?1 n nI??? wij ( xi ? x )( x j ? x )i ?1 j ?1 2 ( x ? x ) ? i i ?1 nnn18 莫兰指数 I 的取值一般介于-1 到 1 之间,大于 0 表示正自相关, 即高值与高值相邻、低值与低值相邻;小于 0 表示负自相关,即 高值与低值相邻。 如果莫兰指数 I 接近于 0,则表明空间分布是随机的,不存在空 间自相关。 莫兰指数 I 可视为观测值与其空间滞后(spatial lag)的相关系数。 如果将观测值与其空间滞后画成散点图,称为“莫兰散点图” (Moran scatterplot),则莫兰指数 I 就是该散点图回归线的斜率。 (即不存在空间自相关)。 考虑原假设 “ H 0 : Cov( xi , x j ) ? 0, ?i ? j ”19 在此原假设下,莫兰指数 I 的期望值为E( I ) ? ?1 n ?1莫兰指数 I 的方差表达式更为复杂,记为 Var( I ) 。 标准化的莫兰指数 I 服从渐近标准正态分布:I ? E( I ) d ?? ? N (0, 1) I ? Var( I )*在使用莫兰指数 I 检验空间自相关时,须注意两个问题。20 问题之一,莫兰指数 I 取决于空间矩阵W ,如果空间矩阵设定 不正确,则可能导致错误的结果。 问题之二, 莫兰指数 I 的核心成分为 ( xi ? x )( x j ? x ) , 其隐含假设 是? xi ?i ?1的期望值为常数(constant mean),不存在任何趋势(trend)。n如果存在趋势,则可能导致检验结果出现偏差。 为了解决问题一,须仔细选择合适的空间矩阵,或使用不同的 空间矩阵以考察结果的稳健性。 为了解决问题二,可引入协变量,通过回归的方法去掉趋势, 然后对残差项进行莫兰指数 I 检验。21 以上的莫兰指数 I 也被称为 “全局莫兰指数 I” (global Moran’s I), n 考察整个空间序列? xi ?i ?1的空间集聚情况。 如果想知道某区域 i 附近的空间集聚情况, 可使用 “局部莫兰指 数 I”(local Moran’s I):( xi ? x ) n Ii ? wij ( x j ? x ) ? 2 S j ?1局部莫兰指数 I 的含义与全局莫兰指数 I 相似。 莫兰指数 I 并非唯一的空间自相关指标, 另一常用指标为 “吉尔 里指数 C”(Geary’s C)(Geary, 1954),也称为“吉尔里相邻比率” (Geary’s Contiguity Ratio):22 C?(n ? 1) ?? wij ( xi ? x j ) 2i ?1 j ?1nn? n n ?? n 2? 2 ? ?? wij ? ? ? ( xi ? x ) ? ? i ?1 j ?1 ? i ?1 ? ? ??吉尔里指数 C 的核心成分为 ( xi ? x j ) 2 。 吉尔里指数 C 的取值一般介于 0 到 2 之间(2 不是严格上界), 大 于 1 表示负相关,等于 1 表示不相关,而小于 1 表示正相关。 吉尔里指数 C 与莫兰指数 I 呈反向变动;前者比后者对于局部 空间自相关更为敏感。23 在不存在空间自相关的原假设下,吉尔里指数 C 的期望值为 1, 而方差的表达式较复杂,记为 Var(C ) 。 标准化的吉尔里指数 C 服从渐近标准正态分布:C ?1 d ?? ? N (0, 1) C ? Var(C )*莫兰指数 I 与吉尔里指数 C 的共同缺点在于,即无法分别“热 点”(hot spot)与“冷点”(cold spot)区域。 所谓热点区域,即高值与高值聚集的区域;而冷点区域则是低 值与低值聚集的区域。热点区域与冷点区域都表现为正自相关。24 Getis and Ord (1992)提出了以下“Getis-Ord 指数 G” :G??? wij xi x ji ?1 j ?1 n nnn?? xi x ji ?1 j ?i其中, xi ? 0, ?i ;而 wij 来自非标准化的对称空间权重矩阵,且 所有元素均为 0 或 1。 如果样本中高值聚集在一起,则 G 较大;如果低值聚集在一起, 则 G 较小。25 在无空间自相关的原假设下, E(G ) ??? wiji ?1 j ?innn(n ? 1)。如果 G 值大于此期望值,则表示存在热点区域; 如果 G 值小于此期望值,则表示存在冷点区域。 标准化的 G 服从渐近标准正态分布:G* ? G ? E(G ) d ?? ? N (0, 1) Var(G )如果 G* ? 1.96 ,则可在 5%水平上拒绝无空间自相关的原假设, 认为存在空间正自相关,且存在热点区域。26 如果 G* ? ?1.96 ,则可在 5%水平上拒绝无空间自相关的原假设, 认为存在空间正自相关,且存在冷点区域。 如果要考察某区域 i 是否为热点或冷点,则可使用“局部 Getis-Ord 指数 G” :? wij x j Gi ? j ?i xj ? j ?i以上各种空间自相关指标仅提供是否存在空间效应的初步检 验,深入检验有赖于建立正式的空间计量模型。27 29.4 空间自回归模型 对于时间序列,最常见的建模方式为一阶自回归 AR(1)。 空间自回归的形式更为复杂,因为空间滞后可以来自不同的方 向,而且可以双向。 对于空间序列? yi ?i ?1 (样本容量为 n),即使假设空间自相关的形n式为线性,待估计的参数在理论上最多可达 (n 2 ? n) 个(每个区域最 多可受 n ? 1个区域影响,共有 n 个区域),大大超出样本容量。 必须假设空间依赖性服从某种共同的模式,才能简化参数。28 首先回顾时间序列的一阶自相关模型:yt ? ? yt ?1 ? ? t(t ? 2,?, n)假设 n = 4,而 y1 ? ?1 。将这 4 个方程叠放在一起可得:? y1 ? ? 0 0 0 0 ? ? y1 ? ? ?1 ? ?y ? ? 1 0 0 0?? y ? ?? ? ? ? 2 ? ? ? 2 ? ? ?Wy ? ε y?? 2???? ? y3 ? ? 0 1 0 0 ? ? y3 ? ? ? 3 ? ? ? ? ?? ? ? ? y 0 0 1 0 ? ? ? y4 ? ? ? 4 ? ? 4? ?? ? ??? ?W其中,矩阵W 的次主对角线元素均为 1,而其他元素都为 0。29 矩阵W 可视为“时间滞后矩阵” ,它之所以呈现出次对角线元素 为 1 而其他元素为 0 的规律性排列,正是由于时间滞后在方向上 的单一性。 对于空间序列,矩阵W 则为空间权重矩阵,其元素排列方式表 现出多样性(因为空间自相关可以多方向)。 引入以下 “空间自回归模型” (Spatial Autoregression, 简记 SAR):y ? ?Wy ? ε其中, W 为已知的空间权重矩阵(非随机), 而空间依赖性仅由单 一参数 ? 。30 ? 度量空间滞后Wy 对 y 的影响,称为“空间自回归系数”(spatial autoregressive parameter)。此模型也称为“空间滞后模型”(Spatial Lag Model)。 相邻地区的被解释变量(比如犯罪率)可能相互依赖, 并最终形成 一个均衡的结果。 又比如,假设以地区税收为被解释变量,则不同地区的政府出 于相互竞争或博弈的考虑(比如,竞相吸引 FDI),在制定本地区税 收时,会考虑周边地区的税收水平。 假设W 为前例的权重矩阵,则方程可写为:31 ? y1 ? ?0 ?y ? ?1 2 ? ? ? ?? ? y3 ? ?1 ? ? ? y ?1 ? 4?1 0 1 01 1 0 11 ? ? y1 ? ? ?1 ? ? y2 ? y3 ? y4 ? ? ?1 ? ? y ? y ? ?? ? ? y ? ?? ? 0 ?? 1 3 2 2 ??? 2? ??? ? ? ?? ? ? y1 ? y2 ? y4 ? ? ? 3 ? 1 ? ? y3 ? ? ? 3 ? ? ? ? ? ?? ? ? ? y y ? 0 ? ? y4 ? ? ? 4 ? 1 3 ? ? ??4 ?如果对此联立方程系统进行 OLS 估计,将导致联立方程偏差 (simultaneity bias)。 由于空间依赖性,导致变量? yi ?i ?1 之间互相影响,产生内生性。n更一般地,可在方程中加入自变量:y ? ?Wy ? Xβ ? ε32 其中,X 为 n ? k 数据矩阵,包括 k 列解释变量;βk?1 为相应系数。 此方程也称为 SAR 模型。 如果 ? ? 0 ,则简化为一般的线性回归模型。 可通过检验原假设“ H 0 : ? ? 0 ”来考察是否存在空间效应。 对于空间自回归模型,常使用 MLE 估计。 首先,假设扰动项 ε ~ N (0 , ? 2 I n ) 。 其次,方程可写为Ay ? ( I ? ?W ) y ? Xβ ? ε33 其中, A ? ( I ? ?W ) 。 由于雅可比行列式 J ??ε ? ( Ay ? Xβ ) ? Ay 根据 ? ? ? A? ? A , ?y ?y ?y多维正态密度公式,可写出样本的似然函数:L( y | ? , ? , ? ) ? (2?? )2 2 ?n 2? 1 ? (abs A )exp ?? 2 ( Ay ? X ? )?( Ay ? X ? ) ? ? 2? ?其中, abs A 表示行列式 A 的绝对值。34 对数似然函数为:n n 1 ln L( y | ? , ? 2 , ? ) ? ? ln 2? ? ln ? 2 ? ln(abs A ) ? 2 ( Ay ? X ? )?( Ay ? X ? ) 2 2 2?此最大化问题分两步。 第一步,在给定 ? 的情况下,选择最优的 ? , ? 2 。 第二步,代入第一步的最优 ? , ? 2 ,选择最优的 ? 。 在第一步,由于 ? 只出现于最后一项,故等价于使 ( Ay ? X ? )?( Ay ? X ? ) 最小,即 Ay 对 X 进行回归:35 ? ? ( X ?X ) ?1 X ?Ay ? ( X ?X ) ?1 X ?( I ? ?W ) y ? ? ? ?? ? ? ( X ?X ) ?1 X ?y ? ? ( X ?X ) ?1 X ?Wy ? ? 0 L ? ? ( X ?X ) ?1 X ?y ( y 对 X 的 回 归 系 数 ) , 而 其 中 , ? 0 ? ? ( X ?X ) ?1 X ?Wy (Wy 对 X 的回归系数)。 ? L ? 。对? 2 求偏导可得? 2 的 MLE 估计: 只要知道 ? ,即可计算 ? e?e ( M X Ay )?( M X Ay ) ? ? ? ? n n2其中,e 为 Ay 对 X 回归的残差向量,M X ? I n ? X ( X ?X ) ?1 X ? 为消 灭矩阵。36 由于 Ay ? ( I ? ?W ) y ,故e ? M X Ay ? M X ( I ? ?W ) y ? M X y ? ? M X Wy ? e0 ? ? eL其中, e0 ? M X y ( y 对 X 的回归残差),而 eL ? M X Wy (Wy 对 X 的 回归残差)。代入可得:e?e (e0 ? ? eL )?(e0 ? ? eL ) ? ? ? ? n n2? 2。 只要知道 ? ,即可计算?? (? ), ? ? 2 (? ) 代入对数似然函数,可得“集中对数 在第二步,将 β37 似然函数”(concentrated log likelihood function),它只是 ? 的函数。 由于 ? 出现在行列式 A ? I ? ?W ,给计算带来不便。 其中 v1 ,?, vn 为矩阵 A 特征值 可利用等式 A ? ? (1 ? ? vi ) 来计算,i ?1 n(eigenvalues)。 为保证扰动项协方差矩阵为正定,还须限制 ? 的取值为 1 1 ?? ? , 其中 vmin 与 vmax 分别为矩阵 A 的最小与最大特征值, vmin vmax 而 vmin 一定为负数。38 对于 MLE 估计量的渐近协方差矩阵,通过信息矩阵来估计:? ? ? ? 2 ln L ? ? ? ?1 I (? ) ? ? ?E ? ?? ? ? ? ?? ?? ? ? ? ??1其中,? ? (? , ? 2 , ? ) 。 对于空间自回归模型 y ? ?Wy ? Xβ ? ε ,解释变量 X 对 y 的边际 效应并非 β ,因为 X 对 y 产生作用后, y 之间还会相互作用,直至 达到一个新的均衡。39 29.5 空间杜宾模型 空间效应的另一建模方式是, 假设区域 i 的被解释变量 yi 依赖于 其邻居的自变量: y ? Xβ ? WXδ ? εWXδ 表示来自邻居自变量的影响, 其中, 而 δ 为相应的系数向量。例如, 局域 i 的犯罪率不仅依赖于本区域的警力, 还可能依赖于 相邻区域的警力。 此模型称为 “空间杜宾模型” (Spatial Durbin Model), 简记 SDM。 此方程不存在内生性,故可直接进行 OLS 估计;只是解释变量 X 与WX 之间可能存在多重共线性。40 如果 δ ? 0 ,则简化为一般的线性回归模型。 将空间杜宾模型与空间自回归模型相结合:y ? ?Wy ? Xβ ? WXδ ? ε29.6 空间误差模型 空间依赖性还可能通过误差项来体现。考虑以下“空间误差模 型”(Spatial Errors Model,简记 SEM):y ? Xβ ? u其中,扰动项 u 的生成过程为 u ? ? Mu ? ε, ε ~ N (0 , ? 2 I n )41 其中, M 为空间权重矩阵。 扰动项 u 存在空间依赖性,不包含在 X 中但对 y 有影响的遗漏变 量存在空间相关性,或者不可观测的随机冲击存在空间相关性。 如果 ? ? 0 ,则简化为一般的线性回归模型。 代入可得:Bu ? ( I ? ? M )u ? ε其中, B ? I ? ? M 。 对于 SEM 模型,尽管扰动项存在自相关,OLS 仍一致,但缺 乏效率。最有效率的方法为 MLE。42 样本的对数似然函数可写为n n 1 ln L( y | ? , ? 2 , ? ) ? ? ln 2? ? ln ? 2 ? ln(abs B ) ? 2 ( y ? X ? )? B?B ( y ? X ? ) 2 2 2?最大化可分两步进行。? ,即最小化上式最后一项 第 一 步 , 通 过 GLS 计 算 β ? 2。 ( y ? X ? )? B?B ( y ? X ? ) ;然后通过一阶条件得到? ? ( ? ), ? ? 2 ( ? ) 代入对数似然函数,得到集中对数似然 第二步,将 β ?。 函数(仅为 ? 的函数),求解最优的 ?43 ? (? ) 与 在第一步中,由于目标函数涉及 B ? I ? ? M ,故得不到 β ? 2 ( ? ) 的解析表达式。 ?? (1) ,通过第一步 需要在第一步与第二步之间进行迭代,即给定 ? ? (? ? (1) ), ? ? (1) ) 的具体取值,再通过第二步得到 ? ? (2) ,以此类 ? 2 (? 得到 β ? 收敛。 推,直至 ? ? (1) 可通过在第一步进行 OLS 估计,然后代入第二步而 初始值 ? 得到。44 29.7 一般的空间计量模型 更一般的空间计量模型将空间自回归模型(SAR)与空间误差模 型(SEM)结合起来:y ? ?Wy ? Xβ ? u其中,扰动项 u 的生成过程为u ? ? Mu ? ε, ε ~ N (0 , ? 2 I n )其中,W 与 M 分别为被解释变量 y 与扰动项 u 的空间权重矩阵, 二者可以相等。45 此模型称为“带空间自回归误差项的空间自回归模型”(Spatial Autoregressive Model with Spatial Autoregressive Disturbances,简 记 SARAR)。 SAR 模型,SEM 模型以及 SARAR 模型,也统称为“Cliff-Ord 模型”(Cliff and Ord, ; Ord, 1975)。 SAR 模型与 SEM 模型都是 SARAR 模型的特例,分别对应于 ? ? 0 与 ? ? 0 的情形。 对于 SARAR 模型,可进行 MLE 估计。46 样本的对数似然函数为n n ln L( y | ? , ? , ? 2 , ? ) ? ? ln 2? ? ln ? 2 ? ln(abs A ) ? ln(abs B ) 2 2 1 ? 2 ( Ay ? X ? )? B?B ( Ay ? X ? ) 2?最大化仍可分两步进行,并进行迭代,与SEM模型的情形类似。 但MLE估计量存在三个缺陷。 首先,MLE估计量可能计算不方便,特别当空间权重矩阵W 与 M 的维度较高时。47 其次,空间计量模型MLE估计量的大样本理论尚不健全。 再次,如果扰动项 ε 不服从独立同分布的正态分布,则QMLE估 计量可能不一致。 Arraiz et al (2010)通过蒙特卡罗模拟证明,在异方差的情况下, QMLE估计量不一致。 Kelejian and Prucha (, )提出利用工具变量, 通过GMM来估计SARAR模型,称为“广义空间二段最小二乘法” (Generalized Spatial Two-stage Least Square,简记GS2SLS)。此IV 估计量在异方差情况下也一致。48 GS2SLS的计算方便,不会因为样本容量太大而产生困难。 GS2SLS所使用的工具变量为:? X , WX , ?, WqX , MX , MWX ?, MW q X 中线性独立的列向量,?记此工具变量矩阵(matrix of instrumental variables)为 H 。 蒙特卡罗模拟显示,在很多情况下取 q ? 2 即可。 而且 X 为外生变量; 故以上 X 的线性函数为有 由于 X 与 y 相关, 效工具变量。49 GS2SLS法的步骤:?, β ?) 所得估计量 (? 第一步、 使用工具变量矩阵 H 进行2SLS估计。 虽然一致,但并非最有效率,因为没有考虑扰动项 u 存在空间自回 ?。 归。记所得残差为 u? 作为 u 的估计量代入方程,然后 第二步、将第一步的2SLS残差 u ?。 进行GMM估计,得到估计量 ?? 对方程进行“空间 Cochrane-Orcutt 变换” 第三步、 使用 ? (spatial Cochrane-Orcutt transformation),以去掉扰动项的空间自相关。50 对 于 时 间 序 列 ? yt ? , 如 果 其 扰 动 项 存 在 一 阶 自 回 归 , 比 如 ut ? ? ut ?1 ? ? t , 则 可 通 过 做 准 差 分 ( 即 Cochrane-Orcutt 变 换) ( yt ? ? yt ?1 ) 来消除此自相关。 对于空间序列,可做类似的变换。 将方程两边同时左乘 ( I ? ? M ) 可得:( I ? ? M ) y ? ? ( I ? ? M )Wy ? ( I ? ? M ) Xβ ? ( I ? ? M )u ?? ?? ??ε新扰动项 ε ? ( I ? ? M )u 不再存在空间自相关。? 代入此方程,再次使用工具变量 H 对变换后 将第二步估计量 ? ? ) ,其相应残差为 u ?, β ?。 的方程进行 2SLS 估计,记所得估计量为 (?51 ? 作为 u 的估计量代入方程, 第四步、将第三步的GS2SLS残差 u ?。 然后进行GMM估计,得到估计量 ?由于此估计量将2SLS用于空间数据,且使用了广义最小二乘法 (Cochrane-Orcutt变换是GLS的特例),故称为“广义空间二段最小 二乘法”。 GS2SLS法的优点是计算方便且结果稳健(异方差情况下也成 立); 缺点是必须有外生变量 X , 故不适用于没有外生变量的纯SAR 模型。52 29.8 含内生解释变量的 SARAR 模型 GS2SLS 法可推广到包含内生解释变量的情形:y ? ?Wy ? Xβ ? Zδ ? u其中, Z 由内生解释变量所组成,而扰动项 u 的生成过程为u ? ? Mu ? ε, ε ~ N (0 , ? 2 I n )假设在 X 之外,尚有不在方程中的外生变量 X e 。 定义 X f ? ( X , X e ) ;如果没有不在方程中的外生变量 X e ,则Xf ? X。53 定义工具变量矩阵 H 为:?Xq q , WX , ? , W X , MX , MWX ? , MW X f 中线性独立的列 f f f f f?向量,即可进行 GS2SLS 估计。 29.9 空间面板模型 考察面板的空间自回归模型:? ? ? ui ? ? it yit ? ? wi? yt ? xit(i ? 1,?, t ? 1,?, T )n其中, wi? 为空间权重矩阵W 的第 i 行, wi? yt ? ? j ?1 wij y jt , wij 为空 间权重矩阵W 的 (i, j ) 元素;而 ui 为区域 i 的个体效应。54 如果不考虑空间滞后项 ? wi? yt ,则为标准的静态面板模型。 进一步,如果 ui 与 xit 相关,则为固定效应模型;反之,则为随 机效应模型。 对于固定效应的空间自回归模型,可先做组内离差变换,去掉 个体效应 ui ; 然后再用类似于横截面空间自回归模型的 MLE 估计。 对于随机效应的空间自回归模型,可先做广义离差变换,然后 进行 MLE 估计。 在决定使用固定效应还是随机效应模型时,可进行通常的豪斯 曼检验。55 对于空间面板模型的 MLE 估计,可通过非官方命令 xsmle 来 实现。此命令可估计很一般的空间面板模型:? ? ? d i?X t δ ? ui ? ? t ? ? it ? yit ? ? yi , t ?1 ? ? wi? yt ? xit ? ?? it ? ? mi?εt ? vit其中, yi , t ?1 为被解释变量 yit 的一阶滞后(即动态面板;如果不是动 态面板,可令? ? 0 ); d i?X t δ 表示解释变量的空间滞后, d i? 为相应 空间权重矩阵 D 的第 i 行;? t 为时间效应;而 mi? 为扰动项空间权 重矩阵 M 的第 i 行。 由于此模型太一般, 故通常考虑以下特殊情形(每种情形均以命 令 xsmle 所使用的术语来命名): 。56 (1) 如果 ? ? 0 ,则为“空间杜宾模型”(Spatial Durbin Model, 简记 SDM)。 (2) 如 果 ? ? 0 且 δ ? 0 , 则 为 “ 空 间 自 回 归 模 型 ” (Spatial Autoregression Model,简记 SAR)。 (3) 如 果 ? ? 0 且 δ ? 0 , 则 为 “ 空 间 自 相 关 模 型 ” (Spatial Autocorrelation Model,简记 SAC);即上文的 SARAR 模型。 (4) 如果? ? ? ? 0 且 δ ? 0 ,则为“空间误差模型” (Spatial Error Model,简记 SEM)。57 29.10 空间计量方法的局限性 空间计量的主要估计方法之一为 MLE,但此 MLE 的大样本 理论尚待完善。 空间计量的另一局限是,它需要研究者主观设定一个非随机 的空间权重矩阵(而非根据数据来估计此矩阵), 而此空间权重矩阵 很可能无法完全反映不同地区之间复杂的相互关系。 处理区域间互动关系的另一方法是直接将地区间的距离作为 变量引入回归模型。58 比如,在国际贸易领域,常使用以下模型来考察两国间贸易 量的决定因素:Exportij ?? Yi ? Y j?? Dij其中,Exportij 表示 i 国对 j 国的出口额,Yi , Y j 分别为 i 国与 j 国 的 GDP, 而 Dij 为 i 国与 j 国之间的地理距离(通常以首都间的距离 来衡量)。 此式很像牛顿的万有引力公式,故称为“引力模型” (gravity model)。59 对方程两边取对数,并加上误差项:ln Exportij ? ln ? ? ? ln Yi ? ? ln Y j ? ? ln Dij ? ?在对引力模型的拓展研究中,经济学家又加入了影响贸易的其 他因素,比如地理因素(如岛国、高山)、关税与非关税壁垒、边 界效应、文化、宗教、语言、甚至政治制度(比如民主程度),参 见余淼杰(2013)。60
更多搜索:
All rights reserved Powered by
文档资料库内容来自网络,如有侵犯请联系客服。

我要回帖

更多关于 java 调用命令行 的文章

 

随机推荐