计量经济学实验报告F=(R2/q)/((1-R2)/(n-k-1)),q是什么

计量经济学实验报告 英文版_百度文库
您的浏览器Javascript被禁用,需开启后体验完整功能,
赠送免券下载特权
10W篇文档免费专享
部分付费文档8折起
每天抽奖多种福利
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
计量经济学实验报告 英文版
阅读已结束,下载本文需要
想免费下载本文?
定制HR最喜欢的简历
下载文档到电脑,同时保存到云知识,更方便管理
加入VIP
还剩9页未读,
定制HR最喜欢的简历
你可能喜欢计量经济学期末考试题库(完整版)及答案_百度文库
您的浏览器Javascript被禁用,需开启后体验完整功能,
赠送免券下载特权
10W篇文档免费专享
部分付费文档8折起
每天抽奖多种福利
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
计量经济学期末考试题库(完整版)及答案
&&看完期末考试保证不挂科
阅读已结束,下载本文需要
想免费下载本文?
定制HR最喜欢的简历
下载文档到电脑,同时保存到云知识,更方便管理
加入VIP
还剩31页未读,
定制HR最喜欢的简历
你可能喜欢当前位置: >>
计量经济学分章习题与答案1
第一章二、单项选择题导论1.同一统计指标按时间顺序记录的数据序列称为 A、横截面数据 C、时间序列数据 B、虚变量数据 D、平行数据)2、 样本数据的质量问题可以概括为完整性、 准确性、 可比性和 A、时效性 C、广泛性 B、一致性 D、系统性()3、有人采用全国大中型煤炭企业的截面数据,估计生产函数模型,然后用该模型预测未来 煤炭行业的产出量, 这是违反了数据的哪一条原则。 A、一致性 C、可比性 B、准确性 D、完整性 ( ) ( )4、 判断模型参数估计量的符号、 大小、 相互之间关系的合理性属于什么检验? A、经济意义检验 C、计量经济学检验 B、统计检验 D、模型的预测检验5、 对下列模型进行经济意义检验, 哪一个模型通常被认为没有实际价值? A、 Ci (消费) ? 500 ? 0.8Ii (收入) B、 Qdi (商品需求) ? 10 ? 0.8Ii (收入) ?0.9P i (价格) C、 Qsi (商品供给) ? 20 ? 0.75P i (价格) D、 Yi (产出量) ? 0.65Ki (资本) Li (劳动)0.60.4()6、 设 M 为货币需求量, Y 为收入水平, r 为利率, 流动性偏好函数为 M ? ?0 ? ?1Y ? ?2r ? ? ,? 和? ? 分别为 ? 、? 的估计值, 根据经济理论有 ( ? 1 2 1 2 ? 应为正值, ? ? 应为正值, ? ? 应为负值 ? 应为正值 A、 ? B、 ? 1 1 2 2 ? 应为负值, ? ? 应为负值, ? ? 应为负值 ? 应为正值 C、 ? D、 ?12)12三、填空题1 、 在 经 济变 量 之 间的 关系 中 , 最重要,是计量经济分析的重点。 2、从观察单位和时点的角度看,经济数据可分为 时间序列数据 数据 3 、根据包含的方程的数量以及是否反映经济变量与时间变量的关系,经济模型可分为 时间序列模型、单方程模型、联立方程组模型 。 截面数据 面板 因果 关 系、相 互 影 响 关系 、五、计算分析题1 1、下列假想模型是否属于揭示因果关系的计量经济学模型?为什么? (1) S t =112.0+0.12 Rt ,其中 S t 为第 t 年农村居民储蓄增加额(单位:亿元) , Rt 为第 t 年 城镇居民可支配收入总额(单位:亿元) 。 (2) St ?1 =.30 Rt ,其中 St ?1 为第 t-1 年底农村居民储蓄余额(单位:亿元) , Rt 为 第 t 年农村居民纯收入总额(单位:亿元) 。 (1)不是。因为农村居民储蓄增加额应与农村居民可支配收入总额有关,而与城镇居民可 支配收入总额没有因果关系。 (2)不是。第 t 年农村居民的纯收入对当年及以后年份的农村居民储蓄有影响,但并不对 第 t-1 的储蓄产生影响2、 指出下列假想模型中的错误,并说明理由:RSt ? 8300.0 ? 0.24RIt ? 1.12IVt其中,RSt 为第 t 年社会消费品零售总额 (单位: 亿元) ,RI t 为第 t 年居民收入总额 (单 位:亿元) (指城镇居民可支配收入总额与农村居民纯收入总额之和) , IVt 为第 t 年全 社会固定资产投资总额(单位:亿元) 。一是居民收入总额 RIt 前参数符号有误,应是正号;二是全社会固定资产投资总额 IVt 这一解释变量的选择有误,它对社会消费品零售总额应该没有直接的影响。3、 下列设定的计量经济模型是否合理?为什么? (1) GDP ? ? 0 ??3 i ?1?i ? GDPi ? ?其中, GDP i (i=1,2,3)是第一产业、第二产业、第三产业增加值, ? 为随机干扰项。 (2)财政收入=f(财政支出)+? , ? 为随机干扰项。(1)不合理,因为作为解释变量的第一产业、第二产业和第三产业的增加值是 GDP 的构成 部分,三部分之和正为 GDP 的值,因此三变量与 GDP 之间的关系并非随机关系,也非 因果关系。 (2)不合理,一般来说财政支出影响财政收入,而非相反,因此若建立两者之间的模型,2 解释变量应该为财政收入,被解释变量应为财政支出;另外,模型没有给出具体的数学 形式,是不完整的。第一章 导论一、名词解释 1、截面数据:截面数据是许多不同的观察对象在同一时间点上的取值的统计数据集合,可 理解为对一个随机变量重复抽样获得的数据。 2、时间序列数据:时间序列数据是同一观察对象在不同时间点上的取值的统计序列,可理 解为随时间变化而生成的数据。 3、虚变量数据:虚拟变量数据是人为设定的虚拟变量的取值。是表征政策、条件等影响研 究对象的定性因素的人工变量,其取值一般只取“0”或“1” 。 4、 内生变量与外生变量: 。 内生变量是由模型系统决定同时可能也对模型系统产生影响的变 量,是具有某种概率分布的随机变量,外生变量是不由模型系统决定但对模型系统产生影响 的变量,是确定性的变量。二、单项选择题 1、C 2、B 3、A 4、A 5、 B 6、A三、填空题 1、因果关系、相互影响关系 2、时间序列数据、截面数据、面板数据 3、时间序列模型、单方程模型、联立方程组模型四、简答题 1、计量经济学与经济理论、统计学、数学的联系主要体现在计量经济学对经济理论、 统计学、数学的应用方面,分别如下: 1)计量经济学对经济理论的利用主要体现在以下几个方面 (1)计量经济模型的选择和确定3 (2)对经济模型的修改和调整 (3)对计量经济分析结果的解读和应用 2)计量经济学对统计学的应用 (1)数据的收集、处理、 (2)参数估计 (3)参数估计值、模型和预测结果的可靠性的判断 3)计量经济学对数学的应用 (1)关于函数性质、特征等方面的知识 (2)对函数进行对数变换、求导以及级数展开 (3)参数估计 (4)计量经济理论和方法的研究2、模型的检验主要包括:经济意义检验、统计检验、计量经济学检验、模型的预测检验。 ①在经济意义检验中,需要检验模型是否符合经济意义,检验求得的参数估计值的符号、 大小、参数之间的关系是否与根据人们的经验和经济理论所拟订的期望值相符合; ②在统计检验中,需要检验模型参数估计值的可靠性,即检验模型的统计学性质,有拟 合优度检验、变量显著检验、方程显著性检验等; ③在计量经济学检验中,需要检验模型的计量经济学性质,包括随机扰动项的序列相关 检验、异方差性检验、解释变量的多重共线性检验等; ④模型的预测检验, 主要检验模型参数估计量的稳定性以及对样本容量变化时的灵敏度, 以确定所建立的模型是否可以用于样本观测值以外的范围。五、计算分析题 1、 (1)不是。因为农村居民储蓄增加额应与农村居民可支配收入总额有关,而与城镇居民 可支配收入总额没有因果关系。 (2)不是。第 t 年农村居民的纯收入对当年及以后年份的农村居民储蓄有影响,但并不 对第 t-1 的储蓄产生影响。2、一是居民收入总额 RIt 前参数符号有误,应是正号;二是全社会固定资产投资总额 IVt 这一解释变量的选择有误,它对社会消费品零售总额应该没有直接的影响。3、 (1)不合理,因为作为解释变量的第一产业、第二产业和第三产业的增加值是 GDP 的构 成部分,三部分之和正为 GDP 的值,因此三变量与 GDP 之间的关系并非随机关系,也 非因果关系。4 (2)不合理,一般来说财政支出影响财政收入,而非相反,因此若建立两者之间的模型, 解释变量应该为财政收入,被解释变量应为财政支出;另外,模型没有给出具体的数学 形式,是不完整的。5 第二章二、单项选择题一元线性回归模型( )? ?? ? X ?e , 1、 设 OLS 法得到的样本回归直线为 Yi ? ? 1 2 i i 以下说法正确的是A、? ?Y C、 Y?e ? 0i? ?0 ?eY D、 ? e X ? 0B、i ii i2、 回归分析中定义的 A、解释变量和被解释变量都是随机变量 B、解释变量为非随机变量,被解释变量为随机变量 C、解释变量和被解释变量都为非随机变量 D、解释变量为随机变量,被解释变量为非随机变量 3、 一元线性回归分析中的回归平方和 ESS 的自由度是 A、n B、n-1 C、n-k D、1()()? 的特性在以下哪种情况下不会受到影 4、对于模型 Yi ? ?0 ? ?1 X i ? ?i ,其 OLS 的估计量 ? 1响 A、观测值数目 n 增加 C、 X i 各观测值基本相等?( B、 X i 各观测值差额增加 D、 E(?i2 ) ? ? 2)5、某人通过一容量为 19 的样本估计消费函数(用模型 Ci ? ? ? ?Yi ? ?i 表示) ,Yi , R2 =0.98, t0.025 (17) ? 2.110 ,则下面 并获得下列结果: C i ? 15 ? 0.81(3.1) (1.87wx) 哪个结论是对的? A、 Y 在 5%显著性水平下不显著 C、 ? 的 95%置信区间不包括 0 B、 ? 的估计量的标准差为 0.072 D、以上都不对 ( ) B、 Yt ( )6、在一元线性回归模型中,样本回归方程可表示为:? ?0 ? ?1 X t ? ?t ? ?? ?X ? ?? C、 Y t 0 1 tA、 Yt 7、 最小二乘准则是指按使 ( A、? E (Y / X t ) ? ?t( )D、 E(Y / X t ) ? ?0 ? ?1 X t ) 达到最小值的原则确定样本回归方程 B、? eii ?1n?ei ?1niC、 max eiD、?ei ?1n2 i? 表示 OLS 回归估计值, Y 8、 设 Y 表示实际观测值, 则下列哪项成立()? A、 Y ? Y? B、 Y ? Y? ?Y C、 Y? ?Y D、 Y)最大的准则确定样本9、最大或然准则是按从模型中得到既得的 n 组样本观测值的(6 回归方程。 A、离差平方和 C、概率 B、均值 D、方差()10、一元线性回归模型 Yi ? ?0 ? ?1 X i ? ?i 的最小二乘回归结果显示,残差平方和 RSS=40.32, 样本容量 n=25, 则回归模型的标准差 ? 为 A、1.270 B、1.324 C、1.613 D、1.753 ( ) ( )? 具备有效性是指 11、 参数 ?i 的估计量 ? i? )?0 A、 Var ( ? i? ?? ?0 C、 ? i iA、总离差平方和 B、回归平方和? ? ? ) 最小 D、在 ?i 的所有线性无偏估计中 ( ? i i( D、可决系数 ( ) ) C、残差平方和? ) 最小 B、在 ?i 的所有线性无偏估计中 Var ( ? i12、 反映由模型中解释变量所解释的那部分离差大小的是13、 总离差平方和 TSS、 残差平方和 RSS 与回归平方和 ESS 三者的关系是 A、TSS&RSS+ESS C、TSS&RSS+ESS B、TSS=RSS+ESS D、TSS2=RSS2+ESS214、对于回归模型 Yi ? ?0 ? ?1 X i ? ?i , i = 1,2,?,n 检验 H 0 : ?1 ? 0 时, 所用的统计量 A、 ? (n ? 2)2? ?? ? 1 1 S ??1服从 B、 t (n ? 1) D、 t (n ? 2)2()C、 ? (n ? 1)215、 某一特定的 X 水平上, 总体 Y 分布的离散程度越大, 即 ? 越大, 则 A、预测区间越宽,精度越低 C、预测区间越窄,精度越高()B、预测区间越宽,预测误差越小 D、预测区间越窄,预测误差越大三、多项选择题1、 一元线性回归模型 Yi ? ?0 ? ?1 X i ? ?i 的基本假定包括 A、 E(?i ) ? 0 C、 Cov(?i , ? j ) ? 0 B、 Var (?i ) ? ?2()(i ? j)D、 ?i ~ N (0,1) ( )E、X 为非随机变量,且 Cov( X i , ?i ) ? 0? 表示回归估计值, Y 2、 以 Y 表示实际观测值, e 表示残差, 则回归直线满足A、通过样本均值点 ( X,Y ) C、 Cov( X i , ei ) ? 0? ?Y E、 Y?) ?0 ?(Y ?Y ? D、 ?Y ? ?YB、2 i i i i3、以带“^”表示估计值, ? 表示随机干扰项,如果 Y 与 X 为线性关系,则下列哪些是正7 确的 A、 Yi ? ?0 ? ?1 X i B、 Yi ? ?0 ? ?1 X i ? ?i()? ?? ? X ?? C、 Yi ? ? 0 1 i i? ?? ? X ?e D、 Yi ? ? 0 1 i i)? ?? ?X 7 ? ?? E、 Y i 0 1 i4、 假设线性回归模型满足全部基本假设, 则其最小二乘回归得到的参数估计量具备 ( A、可靠性 C、线性 E、有效性 5、 下列相关系数算式中, 正确的是 A、 ( B、 ) B、一致性 D、无偏性XY ? X ? Y? x? y? x? y?(Xi? X )(Yi ? Y ) n? x? yiC、Cov( X , Y )D、?(X ?(Xi? X )(Yi ? Y )2? X)? (Y ? Y )i2E、?X?X Y2 ii i? nX ? Y? nX 2?Y2i? nY 2二、判断题1、满足基本假设条件下,随机误差项 ? i 服从正态分布,但被解释变量 Y 不一定服从正态分 布。 2、 总体回归函数给出了对应于每一个自变量的因变量的值。 3、 线性回归模型意味着变量是线性的。 4、 解释变量是作为原因的变量, 被解释变量是作为结果的变量。 5、 随机变量的条件均值与非条件均值是一回事。 6、 线性回归模型 Yi ? ?0 ? ?1 X i ? ?i 的 0 均值假设可以表示为 7、 如果观测值 X i 近似相等, 也不会影响回归系数的估计量。 释变量的解释能力。 ( ( ( ( (n) ) ) ) ) ) )1 ?? ? 0。 n i ?1( (8、样本可决系数高的回归方程一定比样本可决系数低的回归方程更能说明解释变量对被解 ( )9、模型结构参数的普通最小二乘估计量具有线性性、无偏性、有效性,随机干扰项方差的 普通最小二乘估计量也是无偏的。 ( )10、回归系数的显著性检验是用来检验解释变量对被解释变量有无显著解释能力的检验。 ( )四、简答题1、为什么计量经济学模型的理论方程中必须包含随机干扰项?8 2、总体回归函数和样本回归函数之间有哪些区别与联系?3、为什么用可决系数 R 评价拟合优度,而不是用残差平方和作为评价标准?24、根据最小二乘原理,所估计的模型已经使得拟合误差达到最小,为什么还要讨论模型的 拟合优度问题?五、计算分析题1、令 kids 表示一名妇女生育孩子的数目, educ 表示该妇女接受过教育的年数。生育率对 受教育年数的简单回归模型为kids ? ? 0 ? ?1educ? ? ? (1)随机扰动项 包含什么样的因素?它们可能与受教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。解: (1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上述 简单回归模型中,它们被包含在了随机扰动项之中。有些因素可能与受教育水平相关, 如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。9 (2)当归结在随机扰动项中的重要影响因素与模型中的教育水平 educ 相关时,上述回 归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随 机扰动项相关的情形,基本假设 3 不满足。 2、已知回归模型 E ? ? ? ?N ? ? ,式中 E 为某类公司一名新员工的起始薪金(元) ,N 为 所受教育水平(年) 。随机扰动项 ? 的分布未知,其他所有假设都满足。 (1)从直观及经济角度解释 ? 和 ? 。? 满足线性性、无偏性及有效性吗?简单陈述理由。 ? 和? (2)OLS 估计量 ?(3)对参数的假设检验还能进行吗?简单陈述理由。 (4)如果被解释变量新员工起始薪金的计量单位由元改为 100 元,估计的截距项、斜率 项有无变化? (5) 若解释变量所受教育水平的度量单位由年改为月, 估计的截距项与斜率项有无变化?2、解: (1) ? ? ?N 为接受过 N 年教育的员工的总体平均起始薪金。当 N 为零时,平均薪金 为 ? ,因此 ? 表示没有接受过教育员工的平均起始薪金。 ? 是 N 每变化一个单位所引 起的 E 的变化,即表示每多接受一年教育所对应的薪金增加值。? 满足线性性、无偏性及有效性,因为这些性质的的成立无需 ? 和仍 ? (2)OLS 估计量 ?随机扰动项 ? 的正态分布假设。 (3)如果 ?t 的分布未知,则所有的假设检验都是无效的。因为 t 检验与 F 检验是建立 在 ? 的正态分布假设之上的。 (4)考察被解释变量度量单位变化的情形。以 E*表示以百元为度量单位的薪金,则E ? E * ?100 ? ? ? ?N ? ?由此有如下新模型E* ? (? / 100) ? (? / 100) N ? (? / 100)或E* ? ? * ? ? * N ? ? *这里 ? * ? ? / 100 , ? * ? ? / 100。所以新的回归系数将为原始模型回归系数的 1/100 (5)再考虑解释变量度量单位变化的情形。设 N*为用月份表示的新员工受教育的时间 长度,则 N*=12N,于是E ? ? ? ?N ? ? ? ? ? ? ( N * / 12) ? ?或E ? ? ? (? / 12) N * ? ?可见,估计的截距项不变,而斜率项将为原回归系数的 1/12。10 3、假设模型为 Yt ? ? ? ?X t ? ?t 。给定 n 个观察值 ( X 1 , Y1 ) , ( X 2 , Y2 ) ,?, ( X n , Yn ) , 按如下步骤建立 ? 的一个估计量:在散点图上把第 1 个点和第 2 个点连接起来并计算该直 线的斜率;同理继续,最终将第 1 个点和最后一个点连接起来并计算该条线的斜率;最后对? ,即 ? 的估计值。 这些斜率取平均值,称之为 ? ? 的代数表达式。 (1)画出散点图, 推出 ? ? 的期望值并对所做假设进行陈述。 (2) 计算 ? 这个估计值是有偏还是无偏的?解释理由。(3)判定该估计值与我们以前用 OLS 方法所获得的估计值相比的优劣,并做具体解释。 解: (1)散点图如下图所示。 (X2,Y2) (Xn,Yn) (X1,Y1) 首 先 计 算 每 条 直 线 的 斜 率 并 求 平 均 斜 率 。 连 接 ( X 1 , Y1 ) 和 ( X t , Yt ) 的 直 线 斜 率 为(Yt ? Y1 ) /( X t ? X 1 ) 。由于共有 n -1 条这样的直线,因此 t ?n Y ? Y1 ?? 1 ? [ t ] ? n ? 1 t ?2 X t ? X 1(2)因为 X 非随机且 E(?t ) ? 0 ,因此E[Yt ? Y1 (? ? ?X t ? ? t ) ? (? ? ?X 1 ? ?1 ) ? ? ?1 ] ? E[ ] ? ? ? E[ t ]?? X t ? X1 X t ? X1 X t ? X1这意味着求和中的每一项都有期望值 ? ,所以平均值也会有同样的期望值,则表明是无 偏的。 (3)根据高斯-马尔可夫定理,只有 ? 的 OLS 估计量是最佳线性无偏估计量,因此,? 的有效性不如 ? 的 OLS 估计量,所以较差。 这里得到的 ?4、对于人均存款与人均收入之间的关系式 S t ? ? ? ?Yt ? ?t 使用美国 36 年的年度数据得 如下估计模型,括号内为标准差:? = 384.105+0.067Y S t t (151.105)R 2 =0.538(1) ? 的经济解释是什么? (2)? 和 ? 的符号是什么?为什么?实际的符号与你的直觉一致吗?如果有冲突的话,你(0.011)? ? 1 9 .0 ? 92 311 可以给出可能的原因吗? (3)对于拟合优度你有什么看法吗? (4)检验是否每一个回归系数都与零显著不同(在 1%水平下) 。同时对零假设和备择假设、 检验统计值、其分布和自由度以及拒绝零假设的标准进行陈述。你的结论是什么? 4、解: (1) ? 为收入的边际储蓄倾向,表示人均收入每增加 1 美元时人均储蓄的预期平均变 化量。 (2)由于收入为零时,家庭仍会有支出,可预期零收入时的平均储蓄为负,因此 ? 符 号应为负。储蓄是收入的一部分,且会随着收入的增加而增加,因此预期 ? 的符号为正。 实际的回归式中, ? 的符号为正,与预期的一致。但截距项为正,与预期不符。这可能 是模型的错误设定造成的。如家庭的人口数可能影响家庭的储蓄行为,省略该变量将对 截距项的估计产生了影响;另外线性设定可能不正确。 (3)拟合优度刻画解释变量对被解释变量变化的解释能力。模型中 53.8%的拟合优度, 表明收入的变化可以解释储蓄中 53.8 %的变动。 (4)检验单个参数采用 t 检验,零假设为参数为零,备择假设为参数不为零。在零假设 下 t 分布的自由度为 n-2=36-2=34。 由 t 分布表知, 双侧 1%下的临界值位于 2.750 与 2.704 之间。斜率项的 t 值为 0.067/0.011=6.09,截距项的 t 值为 384.105/151.105=2.54。可见斜 率项的 t 值大于临界值,截距项小于临界值,因此拒绝斜率项为零的假设,但不拒绝截 距项为零的假设。5、现代投资分析的特征线涉及如下回归方程: rt? ?0 ? ?1rmt ? ?t ;其中: r 表示股票或债券的收益率;rm 表示有价证券的收益率 (用市场指数表示, 如标准普尔 500 指数) ;t 表示时间。在投资分析中, ? 1 被称为债券的安全系数 ? ,是用来度量市场的风险程度的,即市场的发展对公司的财产有何影响。依据
年间 240 个月的数据,Fogler 和 Ganpathy 得到 IBM 股票的回归方程(括号内为标准差) ,市场指数是在芝加哥大学建 立的市场有价证券指数。?t ? 0.7264 ? 1.0598rmt r(0.3001) (0.0728) 要求: (1)解释回归参数的意义; (2)如何解释 R ?2R2 ? 0.4710(3)安全系数 ? ? 1 的证券称为不稳定证券,建立适当的零假设及备选假设,并用 t 检 验进行检验( ? ? 5% ) 。 (1)回归方程的截距 0.7264 表示当 rm ? 0 时的股票或债券收益率,本身没有经济意义;12 回归方程的斜率 1.0598 表明当有价证券的收益率每上升(或下降)1 个点将使得股票或 债券收益率上升(或下降)1.0598 个点。 (2) R 2 为可决系数,是度量回归方程拟合优度的指标,它表明该回归方程中 47.10%的 股票或债券收益率的变化是由 rm 变化引起的。当然 R2 ? 0.4710 也表明回归方程对数 据的拟合效果不是很好。 (3)建立零假设 H 0 : ?1 ? 1 ,备择假设 H1 : ?1 ? 1 , ? ? 0.05 , n ? 240 ,查表可得临 界值 t0.05 (238) ? 1.645 ,由于 t ?? ? 1 1.0598 ? 1 ? 1 S? ? ?10.0728? 0.8214 ? 1.645 ,所以接受零假设 H 0 : ?1 ? 1 ,拒绝备择假设 H1 : ?1 ? 1 。说明此期间 IBM 股票不是不稳定证券。6、假定有如下的回归结果: Yi ? 2.5X i ,其中,Y 表示美国的咖啡的消费量 (杯数/人天) ,X 表示咖啡的零售价格(美元/杯) 。 要求: (1)这是一个时间序列回归还是横截面回归? (2)如何解释截距的意义,它有经济含义吗?如何解释斜率? (3)能否求出真实的总体回归函数? (4)根据需求的价格弹性定义:弹性=斜率×(X/Y) ,依据上述回归结果,你能求出对 咖啡需求的价格弹性吗?如果不能,计算此弹性还需要其他什么信息? 解: (1)这是一个横截面序列回归。 (2)截距 2.6911 表示咖啡零售价为每磅 0 美元时,每天每人平均消费量为 2.6911 杯, 这个数字没有经济意义; 斜率-0.4795 表示咖啡零售价与消费量负相关, 价格上升 1 美元/磅,则平均每天每人消费量减少 0.4795 杯; (3)不能; (4)不能;在同一条需求曲线上不同点的价格弹性不同,若要求出,须给出具体的 X 值 及与之对应的 Y 值。??7、若经济变量 y 和 x 之间的关系为 yi ? A( xi ? 5) 2 e i ,其中 A、?为参数, ? i 为随机误差, 问能否用一元线性回归模型进行分析?为什么? 解:能用一元线性回归模型进行分析。因为: 对方程左右两边取对数可得: ln yi ? ln A ??ln( xi ? 5) ? ?i 2 ln A ? ? 0、 ? ?1、ln( xi ? 5) ? xi? 令 ln yi ? yi?、 2 可得一元线性回归模型: yi? ? ? 0 ? ?1 xi? ? ?i??13 8 、 上 海 市 居 民
年 期 间 的 收 入 和 消 费 数 据 如 表 所 示 , 回 归 模 型 为yi ? ? 0 ? ?1 xi ? ?i ,其中,被解释变量 y i 为人均消费,解释变量 x i 为人均可支配收入。试用普通最小二乘法估计模型中的参数 ? 0 , ?1 ,并求随机误差项方差的估计值。上海市居民
年间的收入和消费数据 年份 83 86 89 可支配收入 630 650 680 830 30
消费 580 570 610 720 990 40 1810 年份 92 95 98 可支配收入 00 70 70 消费 00 60 60解: 列表计算得x ? n i ?1 ny ? ?y ? ?
.22 ?x ? ?xi ?1 2?
.44据此可计算出? ? ? 1?y ? ?x ? ?xi ?1 i ?1 n 2n? .22 ? 0.? ? y?? ?x ? 0 1 ? ? 0.789876 ?
? 144.4067?i ? 144.876 回归直线方程为 : y xi进一步列表计算得: 这里,n=18,所以:?ei ?1n2 i? 14 2 ?? ? ?1 n 2 ? ei n ? 2 i ?1 1 ? ?
18 ? 2 ? 9616 .11六、上机练习题1、 下表给出了美国 30 所知名学校的 MBA 学生 1994 年基本年薪 (ASP) 、 GPA 分数 (从 1~4 共四个等级) 、GMAT 分数以及每年学费的数据。学校 Harvard Stanford Columbian Dartmouth Wharton Northwestern Chicago MIT Virginia UCLA Berkeley Cornell NUY Duke Carnegie Mellon ASP/美元 800 10
GPA 3.4 3.3 3.3 3.4 3.4 3.3 3.3 3.5 3.2 3.5 3.2 3.2 3.2 3.3 3.2 3.2 3.2 3.3 3.2 3.2 3.1 3.2 GMAT 650 665 640 660 650 640 650 650 643 640 647 630 630 623 635 621 630 625 615 581 591 619 学费/美元
North Carolina Michigan Texas Indiana Purdue Case Western Georgetown15 Michigan State Penn State Southern Methodist Tulane Illinois Lowa Minnesota Washington
3.2 3.2 3.1 3.1 3.2 3.2 3.2 3.3590 580 600 600 616 590 600 617
要求: (1)用双变量回归模型分析 GPA 是否对 ASP 有影响? (2)用合适的回归模型分析 GMAT 分数是否与 ASP 有关? (3)每年的学费与 ASP 有关吗?你是如何知道的?如果两变量之间正相关,是 否意味着进到最高费用的商业学校是有利的; (4)你同意高学费的商业学校意味着高质量的 MBA 成绩吗?为什么? 1、解: (1)使用 Eviews 软件,ASP 对 GPA 分数的回归结果如表所示。 Dependent ASP Variable GPA C R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient
- 0..79.439 6.116E+09 -329.563 1.0062756 Std. Error 758.314 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) t-Statistic 3..19179 Prob. 0..60 ....0004319 Variable:从回归结果看,GPA 分数的系数是统计显著的,对 ASP 有正的影响。 (2)使用 Eviews 软件,ASP 对 GMAT 分数的回归结果如表所示。 Dependent ASP Variable GMAT C R-squared Adjusted R-squared Coefficient 641..8 0..707074 Std. Error 76..09 Mean dependent var S.D. dependent var t-Statistic 8..985332 Prob. 0 0 .78 Variable:16 S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat.71E+09 -317.809Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)21.8 71.00122 0从回归结果看,GMAT 分数与 ASP 显著正相关。 (3)使用 Eviews 软件,ASP 对学费 X 的回归结果如表所示。 Dependent ASP Variable X C R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficien t 2.26.32 0..42.78 5.29E+09 -327.178 Std. Error 0.0.863 t-Statistic 4..364446 Prob. 0.2 .78 21.17 22.051 Variable:Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)从计算结果看,每年的学费与 ASP 显著正相关。学费高,ASP 就高;但学费仅解释了 ASP 变化的一部分(不到 50%) ,明显还有其他因素影响着 ASP。 (4)使用 Eviews 软件回归结果如表所示。 Dependent Variable: GPA Variable Coefficien t 6.17E-06 Std. Error 4.09E-0 6 0.07255 9 Mean var S.D. dependent var Akaike criterion17t-StatisticProb.X1.5079520.1428C3.14757943.37936 dependent0 3...6643 11R-squared0.075112Adjusted R-squared0.04208S.E. of regression0.101951info Sum squared resid Log likelihood Durbin-Watson stat0..758Schwarz criterion F-statistic Prob(F-statistic)-1..76 8从回归结果看,尽管高学费的商业学校与高质量的 MBA 成绩略有正县相关性,但学费对 GPA 分数的影响是不显著的,而也无法得出学费是影响 GPA 分数的主要原因的结论。 2、下表给出了
年间的 CPI 指数与 S&P500 指数。年份 92 680CPI 130.7 136.2 140.3 144.5 148.2 152.4 159.6S&P500 指数 334.59 376.18 415.74 451.41 460.33 541.64 670.831995640 S&P要求: (1)以 CPI 指数为横轴、S&P 指数为纵轴做图; (2)你认为 CPI 指数与 S&P 指数之间关系如何? 520 (3)考虑下面的回归模型: (S & P) t ? B1 ? B2 CPIt ? ut ,根据表中的数据运480 440 400 用 OLS 估计上述方程,并解释你的结果;你的结果有经济意义吗?2、解:360 320 130 135 140 145 CPI 150 155 160(1)利用所给数据做图,如图所示(2)从上图可见,CPI 指数与 S&P 指数正相关,且呈近似的新线性关系。 (3)使用Eviews软件回归结果如表所示。 Dependent S&P Variable CPI C R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Coefficient 11.0.826 0....086 -32.47276 Std. Error 1..9488 t-Statistic 9..394122 Prob. 0.4 464.8 9.906 81.39039 Variable:Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic18 Durbin-Watson stat1.187041Prob(F-statistic)0.000279回归结果显示,CPI 指数与 S&P 指数正相关,斜率表示当 CPI 指数变化 1 个点,会使 S&P 指数变化 11.08 个点;截距表示当 CPI 指数为 0 时,S&P 指数为-,此数据没有 明显的经济意义。第二章一、名词解释一元线性回归模型1、总体回归函数:是指在给定 Xi 下 Y 分布的总体均值与 Xi 所形成的函数关系(或者说将 总体被解释变量的条件期望表示为解释变量的某种函数) 2、最大似然估计法(ML): 又叫最大或然法,指用产生该样本概率最大的原则去确定样本 回归函数的方法。 3、OLS 估计法:指根据使估计的剩余平方和最小的原则来确定样本回归函数的方法。 4、残差平方和:用 RSS 表示,用以度量实际值与拟合值之间的差异,是由除解释变量之外 的其他因素引起的被解释变量变化的部分。 5、拟合优度检验:指检验模型对样本观测值的拟合程度,用 R 表示,该值越接近 1 表示拟 合程度越好。2二、单项选择题 1、D 11、B 2、B 12、B 3、D 13、B 4、D 14、D 5、A 6、C 7、D 8、C 9、C 10、B15、A三、多项选择题 1、ABCE 2、ACDE 3、BDE 4、BCDE 5、ABCDE四、判断题 1、× 2、× 3、× 4、√ 5、× 6、× 7、× 8、× 9、√ 10、√五、简答分析题 1、答: 计量经济学模型考察的是具有因果关系的随机变量间的具体联系方式。由于是随机 变量,意味着影响被解释变量的因素是复杂的,除了解释变量的影响外,还有其他无法 在模型中独立列出的各种因素的影响。这样,理论模型中就必须使用一个称为随机干扰 项的变量来代表所有这些无法在模型中独立表示出来的影响因素,以保证模型在理论上19 的科学性。2、答: 将总体被解释变量的条件期望表示为解释变量的某种函数,这个函数就称为总体回 归 函 数 , 其 一 般 表 达 式 为 : E(Y X i ) ? f ( X i ) , 一 元 线 性 总 体 回 归 函 数 为E(Y X i ) ? ?0 ? ?1 X i ;样本回归函数:将被解释变量 Y 的样本观测值的拟和值表示为 ? ?? ?X 。 ? ? f ( X ) ,一元线性样本回归函数为 Y ? ?? 解释变量的某种函数 Yi i i 0 1 i样本回归函数是总体回归函数的一个近似。总体回归函数具有理论上的意义,但其 具体的参数不可能真正知道,只能通过样本估计。样本回归函数就是总体回归函数的参? ,? ? 为 ? ,? 的估计值。 数用其估计值替代之后的形式,即 ? 0 1 0 13、答: 可决系数 R2=ESS/TSS=1-RSS/TSS,含义为由解释变量引起的被解释变量的变化占 被解释变量总变化的比重,用来判定回归直线拟合的优劣,该值越大说明拟合的越好; 而残差平方和与样本容量关系密切,当样本容量比较小时,残差平方和的值也比较小, 尤其是不同样本得到的残差平方和是不能做比较的。此外,作为检验统计量的一般应是 相对量而不能用绝对量,因而不能使用残差平方和判断模型的拟合优度。4、答: 普通最小二乘法所保证的最好拟合是同一个问题内部的比较,即使用给出的样本数 据满足残差的平方和最小; 拟合优度检验结果所表示的优劣可以对不同的问题进行比较, 即可以辨别不同的样本回归结果谁好谁坏。第三章一、名词解释1、多元线性回归模型多元线性回归模型2、调整的决定系数 R 23、偏回归系数20 4、正规方程组5、方程显著性检验二、单项选择题1、在模型 Yt ? ?0 ? ?1 X1t ? ?2 X 2t ? ?3 X 3t ? ?t 的回归分析结果中,有 F ? 462.58 , 则表明 F 的p值 ? 0.000000 , A、解释变量 X 2 t 对 Yt 的影响不显著 B、解释变量 X 1t 对 Yt 的影响显著 C、模型所描述的变量之间的线性关系总体上显著 D、解释变量 X 2 t 和 X 1t 对 Yt 的影响显著 2、设 k 为回归模型中的实解释变量的个数, n 为样本容量。则对回归模型进行总体显著性 检验( F 检验)时构造的 F 统计量为 A、 F ? C、 F ? ( B、 F ? ) ( )ESS k RSS (n ? k ? 1)ESS RSSESS (k ? 1) RSS (n ? k )RSS TSS( )D、 F ? 1 ?3、已知二元线性回归模型估计的残差平方和为 则随机误差项 ?t 的方差的 OLS 估计值为 A、33.33 A、 R ? R2 2 2?e2 i? 800 ,估计用样本容量为 n ? 23 ,B、 40C、 38.092D 、36.3624、在多元回归中,调整后的决定系数 R 与决定系数 R 的关系为 B、 R ? R22()2C、 R ? R2D、 R 与 R 的关系不能确定 ( )25、下面说法正确的有 A、时间序列数据和横截面数据没有差异 B、对回归模型的总体显著性检验没有必要 C、总体回归方程与样本回归方程是有区别的 D、决定系数 R 不可以用于衡量拟合优度2 6、 根据调整的可决系数 R 与 F 统计量的关系可知, 当 R ? 1 时, 有2 2( D、F=-∞ ()A、F=0B、F=-1C、F→+∞? 是随机向量 Y 的函数, ?是 ? ? ( X ?X )?1 X ? 7、 线性回归模型的参数估计量 ? 即? ? Y。)21 A、随机向量 C、确定性向量 8、下面哪一表述是正确的B、非随机向量 D、常量 ( )A、线性回归模型 Yi ? ?0 ? ?1 X i ? ?i 的零均值假设是指1 n ? ?i ? 0 n i ?1B、对模型 Yi ? ?0 ? ?1 X1i ? ?2 X 2i ? ?i 进行方程显著性检验(即 F 检验) ,检验的零假 设是 H0 : ?0 ? ?1 ? ?2 ? 0 C、相关系数较大意味着两个变量存在较强的因果关系 D、当随机误差项的方差估计量等于零时,说明被解释变量与解释变量之间为函数关系? ?? ? X ?? ? X ? …? ? ? X ? e ,如果原模型满足线性模型的基本假设则 9、对于 Yi ? ? 0 1 1i 2 2i k ki i? ) 是 ? 的标准误差) ? s(? ? )(其中 s( ? 在零假设 ? j ? 0 下, 统计量 ? 服从 j j j jA、 t ( n ? k ) B、 t (n ? k ? 1) C、 F (k ? 1, n ? k ) 10、 下列说法中正确的是 A、如果模型的 R2 很高,我们可以认为此模型的质量较好 B、如果模型的 R2 很低,我们可以认为此模型的质量较差 C、如果某一参数不能通过显著性检验,我们应该剔除该解释变量 D、如果某一参数不能通过显著性检验,我们不应该随便剔除该解释变量 ( ) D、 F (k , n ? k ? 1) ( )三、多项选择题1、 残差平方和是指 A、随机因素影响所引起的被解释变量的变差 B、解释变量变动所引起的被解释变量的变差 C、被解释变量的变差中,回归方程不能作出解释的部分 D、被解释变量的总离差平方和回归平方之差 E、被解释变量的实际值与拟合值的离差平方和 2、 回归平方和是指 A、被解释变量的观测值 Yi 与其均值 Y 的离差平方和 ( ) ( )? 与其均值 Y 的离差平方和 B、被解释变量的回归值 Y iC、被解释变量的总体平方和?Y2 i与残差平方和?e2 i之差D、解释变量变动所引起的被解释变量的离差的大小 E、随机因素影响所引起的被解释变量的离差大小 3、 对模型满足所有假定条件的模型 Yi ? ?0 ? ?1 X1i ? ?2 X 2i ? ?i 进行总体显著性检验, 如果 检验结果总体线性关系显著, 则很可能出现 A、 ?1 ? ?2 ? 0 B、 ?1 ? 0, ?2 ? 022() C、 ?1 ? 0, ?2 ? 0 E、 ?1 ? 0, ?2 ? 0D、 ?1 ? 0, ?2 ? 04、设 k 为回归模型中的参数个数(包含截距项)则总体线性回归模型进行显著性检验时所 用的 F 统计量可以表示为 ( )? ? Y ) /(n ? k ? 1) (Y ? A、 ?e / k2 i i 2 i? ?Y ) / k (Y ? B、 ? e /(n ? k ? 1)2 i i 2 iC、R2 / k (1 ? R 2 ) /(n ? k ? 1)D、(1 ? R 2 ) /(n ? k ? 1) R2 / kR 2 /(n ? k ? 1) E、 (1 ? R 2 ) / k5、 在多元回归分析中, 调整的可决系数 R 与可决系数 R 之间 A、 R ? R22 2 2()2B、 R ? R222C、 R 只可能大于零 E、 R 不可能为负值2D、 R 可能为负值四、判断题1、满足基本假设条件下,样本容量略大于解释变量个数时,可以得到各参数的唯一确定的 估计值, 但参数估计结果的可靠性得不到保证 2、 在多元线性回归中, t 检验和 F 检验缺一不可。 3、 回归方程总体线性显著性检验的原假设是模型中所有的回归参数同时为零 4、 多元线性回归中, 可决系数 R 是评价模型拟合优度好坏的最佳标准。2( ( ( () ) ) )5、多元线性回归模型中的偏回归系数,表示在其他解释变量保持不变的情况下,对应解释 变量每变化一个单位时, 被解释变量的变动。 ( )五、简答题1、多元线性回归模型与一元线性回归模型有哪些区别?2、为什么说最小二乘估计量是最优线性无偏估计量?对于多元线性回归最小二乘估计的正 规方程组,能解出唯一的参数估计量的条件是什么?23 六、计算分析题1、某地区通过一个样本容量为 722 的调查数据得到劳动力受教育年数的一个回归方程为edui ? 10.36 ? 0.094sibsi ? 0.131medui ? 0.210 fedui分别为母亲与父亲受到教育的年数。问R2=0.214式中,edu 为劳动力受教育年数,sibs 为劳动力家庭中兄弟姐妹的个数,medu 与 fedu(1)sibs 是否具有预期的影响?为什么?若 medu 与 fedu 保持不变,为了使预测的受 教育水平减少一年,需要 sibs 增加多少? (2)请对 medu 的系数给予适当的解释。 (3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数均为 12 年,另 一个的父母受教育的年数均为 16 年,则两人受教育的年数预期相差多少年? 1、解: (1) 预期 sibs 对劳动者受教育的年数有影响。 因此在收入及支出预算约束一定的条件下, 子女越多的家庭,每个孩子接受教育的时间会越短。 根据多元回归模型偏回归系数的含义,sibs 前的参数估计值-0.094 表明,在其他条件不 变的情况下,每增加 1 个兄弟姐妹,受教育年数会减少 0.094 年,因此,要减少 1 年受 教育的时间,兄弟姐妹需增加 1/0.094=10.6 个。 (2)medu 的系数表示当兄弟姐妹数与父亲受教育的年数保持不变时,母亲每增加 1 年 受教育的时间,其子女作为劳动者就会预期增加 0.131 年的教育时间。 (3)首先计算两人受教育的年数分别为 10.36+0.131?12+0.210?12=14.452 10.36+0.131?16+0.210?16=15.816 因此,两人的受教育年限的差别为 15.816-14.452=1.3642、考虑以下方程(括号内为标准差) :? ? 8.562 ? 0.364P ? 0.004P ? 2.560U W t t t ?1 t(0.080) (0.072) (0.658)n ? 19R 2 ? 0.873其中: Wt ―― t 年的每位雇员的工资Pt ―― t 年的物价水平Ut ―― t 年的失业率要求: (1)进行变量显著性检验; (2)对本模型的正确性进行讨论, Pt ?1 是否应从方程中删除?为什么?24 2、解: (1) 在给定 5%显著性水平的情况下,进行 t 检验。0.364 ? 4.55 0.080 0.004 ? 0.056 Pt ?1 参数的 t 值: 0.072 ?2.560 ? ?3.89 Ut 参数的 t 值: 0.658Pt 参数的 t 值:在 5%显著性水平下, 自由度为 19-3-1=15 的 t 分布的临界值为 t0.025 (15) ? 2.131 , Pt 、Ut 的参数显著不为 0,但不能拒绝 Pt ?1 的参数为 0 的假设。(2)回归式表明影响工资水平的主要原因是当期的物价水平、失业率,前期的物价水平 对他的影响不是很大,当期的物价水平与工资水平呈正向变动、失业率与工资水平呈相 反变动,符合经济理论,模型正确。可以将 Pt ?1 从模型删除.3、以企业研发支出(R&D)占销售额的比重(单位:%)为被解释变量(Y) ,以企业销售 额(X1)与利润占销售额的比重(X2)为解释变量,一个容量为 32 的样本企业的估计结果 如下:Yi ? 0.472 ? 0.32ln X 1i ? 0.05 X 2i (1.37) (0.22) (0.046) R 2 ? 0.099其中,括号中的数据为参数估计值的标准差。 (1)解释 ln(X1)的参数。如果 X1 增长 10%,估计 Y 会变化多少个百分点?这在经济上 是一个很大的影响吗? (2)检验 R&D 强度不随销售额的变化而变化的假设。分别在 5%和 10%的显著性水平 上进行这个检验。 (3)利润占销售额的比重 X2 对 R&D 强度 Y 是否在统计上有显著的影响?3、解: (1)ln(X1)的系数表明在其他条件不变时,ln(X1)变化 1 个单位,Y 变化的单位数,即 ?Y=0.32?ln(X1)?0.32(?X1/ X1)。由此,如果 X1 增加 10%,Y 会增加 0.032 个百分点。这 在经济上不是一个较大的影响。 (2)针对备择假设 H1: ?1 ? 0 ,检验原假设 H0: ?1 ? 0 。易知相应的 t 统计量的值为 t=0.32/0.22=1.455。 在 5%的显著性水平下, 自由度为 32-3=29 的 t 分布的临界值为 2.045, 计算出的 t 值小于该临界值,所以不拒绝原假设。这意味着销售额对 R&D 强度的影响不 显著。在 10%的显著性水平下,t 分布的临界值为 1.699,计算的 t 值小于该值,不拒绝25 原假设,意味着销售额对 R&D 强度的影响不显著。 (3)对 X2,参数估计值的 t 统计值为 0.05/0.46=1.087,它比 10%显著性水平下的临界值 还小,因此可以认为它对 Y 在统计上没有显著的影响。4、假设你以校园内食堂每天卖出的盒饭数量作为被解释变量,以盒饭价格、气温、附近餐 厅的盒饭价格、学校当日的学生数量(单位:千人)作为解释变量,进行回归分析。假设你 看到如下的回归结果(括号内为标准差) ,但你不知道各解释变量分别代表什么。?i ? 10.6 ? 28.4 X1i ? 12.7 X 2i ? 0.61X 3i ? 5.9 X 4i Y(2.6) (6.3) (0.61) (5.9) 试判定各解释变量分别代表什么,说明理由。 、解:R ? 0.632n ? 35(1)答案与真实情况是否一致不一定,因为题目未告知是否通过了经济意义检验。猜测 为: X 1 为学生数量, X 2 为附近餐厅的盒饭价格, X 3 为气温, X 4 为校园内食堂的盒饭 价格; (2)理由是被解释变量应与学生数量成正比,并且应该影响显著;被解释变量应与本食 堂盒饭价格成反比,这与需求理论相吻合;被解释变量应与附近餐厅的盒饭价格成正比, 因为彼此有替代作用;被解释变量应与气温的变化关系不是十分显著,因为大多数学生 不会因为气温变化不吃饭。5、下表给出一二元模型的回归结果。方差来源 来自回归(ESS) 来自残差(RSS) 总离差(TSS) (2) R 和 R ?2平方和(SS) 65965 _― 66042自由度(d.f.) ― ― 14求: (1)样本容量是多少?RSS 是多少?ESS 和 RSS 的自由度各是多少?2(3)检验假设:解释变量总体上对 Y 无影响。你用什么假设检验?为什么? (4)根据以上信息,你能确定解释变量各自对 Y 的贡献吗? 5、解: (1)样本容量为 n=14.+1=15 RSS=TSS-ESS==7726 ESS 的自由度为: d.f.= 2(二元) RSS 的自由度为: d.f.=n-2-1=12 (2)R2=ESS/TSS==0.9988? 2R =1-(1- R2)(n-1)/(n-k-1)=1-0.=0.9986(3)应该采用方程显著性检验,即 F 检验,理由是只有这样才能判断 X1、X2 一起是否 对 Y 有影响。 (4)不能。因为通过上述信息,仅可初步判断 X1、X2 联合起来对 Y 有线性影响,两者 的变化解释了 Y 变化的 99.8%。但由于无法知道 X1,X2 前参数的具体估计值,因此还无 法判断它们各自对 Y 的影响有多大。6、在经典线性回归模型的基本假定下,对含有三个自变量的多元线性回归模型:Yi ? ?0 ? ?1 X1i ? ?2 X 2i ? ?3 X 3i ? ?i你想检验的虚拟假设是 H 0 : ?1 ? 2? 2 ? 1 。? ,? ? 的方差及其协方差求出 Var(? ? ? 2? ? )。 (1)用 ? 1 2 1 2(2)写出检验 H0: ?1 ? 2? 2 ? 1 的 t 统计量。 (3)如果定义 ?1 ? 2? 2 ? ? ,写出一个涉及 ?0、?、?2 和 ?3 的回归方程,以便能直接得 到 ? 估计值 ?? 及其样本标准差。 6、解: (1)? ? 2? ? ) ? Var(? ? ) ? 4Cov(? ? ,? ? ) ? 4Var(? ? ) Var(? 1 2 1 1 2 2(2)t? ? 1 ? 2? 2 ? 1 S ?? 2 ?1 2? 的样本标准差。 ? ? 2? ,其中 S? 为?
2 1 ?2 ?1 2(3)由 ?1 ? 2? 2 ? ? 知 ?1 ? ? ? 2? 2 ,代入原模型得Y ? ? 0 ? (? ? 2? 2 ) X 1 ? ? 2 X 2 ? ? 3 X 3 ? ? ? ? 0 ? ?X 1 ? ? 2 (2 X 1 ? X 2 ) ? ? 3 X 3 ? ?这就是所需的模型,其中 ? 估计值 ?? 及其样本标准差都能通过对该模型进行估计得到。7、 假设要求你建立一个计量经济模型来说明在学校跑道上慢跑一英里或一英里以上的人数, 以便决定是否修建第二条跑道以满足所有的锻炼者。你通过整个学年收集数据,得到两个 可能的解释性方程:? ? 125.0 ?15.0 X ?1.0 X ?1.5X 方程 A: Y i 1i 2i 3i27R 2 ? 0.75 ? ? 123.0 ?14.0 X ? 5.5X ? 3.7 X 方程 B: Y i 1i 2i 4i其中: Yi ――第 i 天慢跑者的人数R 2 ? 0.73X 1i ――第 i 天降雨的英寸数 X 2i ――第 i 天日照的小时数 X 3i ――第 i 天的最高温度(按华氏温度) X 4i ――第 i 天的后一天需交学期论文的班级数请回答下列问题: (1)这两个方程你认为哪个更合理些,为什么? (2)为什么用相同的数据去估计相同变量的系数得到不同的符号? 7、解: (1)方程 B 更合理些。原因是:方程 B 中的参数估计值的符号与现实更接近些,如与 日照的小时数同向变化,天长则慢跑的人会多些;与第二天需交学期论文的班级数成反 向变化。 (2)解释变量的系数表明该变量的单位变化,在方程中其他解释变量不变的条件下,对 被解释变量的影响, 由于在方程 A 和方程 B 中选择了不同的解释变量, 方程 A 选择的是 “该天的最高温度” , 而方程 B 选择的是 “第二天需交学期论文的班级数” , 造成了 X 2 与 这两个变量之间关系的不同,所以用相同的数据估计相同的变量得到了不同的符号。8、考虑以下预测的回归方程:?t ? ?120? 0.10Ft ? 5.33RSt Y年的降雨量(毫米) 。要求回答下列问题:R ? 0.502其中: Yt 为第 t 年的玉米产量(吨/亩) ; Ft 为第 t 年的施肥强度(千克/亩) ; RS t 为第 t(1)从 F 和 RS 对 Y 的影响方面,说出本方程中系数 0.10 和 5.33 的含义; (2)常数项 ?120是否意味着玉米的负产量可能存在? (3)假定 ? F 的真实值为 0.40 ,则 ? F 的估计量是否有偏?为什么? (4)假定该方程并不满足所有的古典模型假设,即参数估计并不是最佳线性无偏估计, 则是否意味着 ? RS 的真实值绝对不等于 5.33 ?为什么? 8、解: (1) 在降雨量不变时,每亩增加 1 千克肥料将使当年的玉米产量增加 0.1 吨/亩;在每亩施 肥量不变的情况下,每增加 1 毫米的降雨量将使当年的玉米产量增加 5.33 吨/亩。 (2) 在种地的一年中不施肥也不下雨的现象同时发生的可能性很小,所以玉米的负产量 不可能存在.事实上,这里的截距无实际意义。 (3) 如果 ? F 的真实值为 0.40,则表明其估计值与真实值有偏误,但不能说 ? F 的估计是有 偏估计.理由是 0.1 是 ? F 的一个估计值,而所谓估计的有偏性是针对估计的期望来说的,即28 如果取遍所有可能的样本,这些参数估计值的平均值与 0.4 有偏误的话,才能说估计是有偏 的。 (4) 不一定。 即便该方程并不满足所有的经典模型假设, 不是最佳线性无偏估计量, ? RS 的真实值也有等于 5.33 的可能性。 因为有偏估计意味着参数估计的期望不等于参数本身, 并不排除参数的某一估计值恰好等于参数的真实值的可能性9、已知描述某经济问题的线性回归模型为 Yi ? ?0 ? ?1 X1i ? ?2 X 2i ? ?i ,并已根据样本容 量为 32 的观察数据计算得( X ?X )?1? 4? ? 2.5 ? 1.3 ? 2.2? ? , e ?e ? 5.8 , TSS ? 26 ? ? Y ?? ? ? ? 1.3 4.4 ? 0.8? , X ? ? 2? ? ? ?? 2.2 ? 0.8 5.0 ? ? ? 2? ?查表得 F0.05 (2,29) ? 3.33, t 0.005 (29) ? 2.756。 (1)求模型中三个参数的最小二乘估计值 (2)进行模型的置信度为 95%的方程显著性检验 (3)求模型参数 ?2 的置信度为 99%的置信区间。 9、解:? 2.5 ? 1.3 ? 2.2? ?4? ? 3 ? ? ?? ? ? ? ?1 X ) X ?Y ? ? (1) B ? ( X ? ? ? 1.3 4.4 ? 0.8? ?2? ? ? 2 ? ? ?? 2.2 ? 0.8 5.0 ? ?? ? 2? ? ? ?? 0.4? ?20.2 ESS / k (2) F ? ? 2 ? 50.5 & F0.05 (2,29) ? 3.33 RSS /(n ? k ? 1) 5.8 29通过方程显著性检验 (3) S ?? ?2C33e?e 5.8 ? 5? ?1 n ? k ?1 29? ? t S ? ) ? (?0.4 ? 2.756 ? 1) (? 2 ? ?22? 2 的 99%的置倍区间为(-3.156 , 2.356)10、下表为有关经批准的私人住房单位及其决定因素的 4 个模型的估计和相关统计值(括号 内为 p 值) (如果某项为空,则意味着模型中没有此变量) 。数据为美国 40 个城市的数据。 模型如下:29 housin g ? ? 0 ? ?1density ? ? 2 value? ? 3income? ? 4 popchang ? ? 5unemp? ? 6 localtax? ? 7 statetax? ?式中:housing――实际颁发的建筑许可证数量;density――每平方英里的人口密度, value――自由房屋的均值(单位:百美元) ;income――平均家庭的收入(单位:千美 元) ;popchang―― 年的人口增长百分比;unemp――失业率;localtax――人 均交纳的地方税;statetax――人均缴纳的州税。变量 C Density Value Income Popchang Unemp Localtax Statetax RSS R2模型 A 813 (0.74) 0.075 (0.43) -0.855 (0.13) 110.41 (0.14) 26.77 (0.11) -76.55 (0.48) -0.061 (0.95) -1.006 (0.40) 4.763e+7 0.349 1.488e+6 1.776e+6模型 B -392 (0.81) 0.062 (0.32) -0.873 (0.11) 133.03 (0.04) 29.19 (0.06)模型 C -) 0.042 (0.47) -0.994 (0.06) 125.71 (0.05) 29.41 (0.001)模型 D -973 (0.44)-0.778 (0.07) 116.60 (0.06) 24.86 (0.08)-1.004 (0.37) 4.843e+7 0.338 1.424e+6 1.634e+6 4.962e+7 0.322 1.418e+6 1.593e+6 5.038e+7 0.312 1.399e+6 1.538e+6? ?2AIC(1)检验模型 A 中的每一个回归系数在 10%水平下是否为零(括号中的值为双边备择 p-值) 。根据检验结果,你认为应该把变量保留在模型中还是去掉? (2)在模型 A 中,在 5%水平下检验联合假设 H0:?i =0(i=1,5,6,7)。说明被择假设,计 算检验统计值,说明其在零假设条件下的分布,拒绝或接受零假设的标准。说明 你的结论。 (3)哪个模型是“最优的”?解释你的选择标准。 (4)说明你对最优模型中参数符号的预期并解释原因,确认其是否为正确符号。 10、解: (1)直接给出了 P 值,所以没有必要计算 t 统计值以及查 t 分布表。根据题意,如果 p值&0.10,则我们拒绝参数为零的原假设。 由于表中所有参数的 p 值都超过了 10%, 所以没有系数是显著不为零的。 但由此去掉 所有解释变量,则会得到非常奇怪的结果。其实正如我们所知道的,在多元回去归中省 略变量时一定要谨慎,要有所选择。本例中,value、income、popchang 的 p 值仅比 0.130 稍大一点,在略掉 unemp、localtax、statetax 的模型 C 中,及进一步略掉 Density 的模型 D 中,这些变量的系数都是显著的。 ( 2 ) 针 对 联 合 假 设 H0 : ?i =0(i=1,5,6,7) 的 备 择 假 设 为 H1 : ?i (i=1,5,6,7) 中至少有一个不为零。检验假设 H0,实际上就是对参数的约束的检验,无约束回归为模 型 A,受约束回归为模型 D,检验统计值为F?( RSSR ? RSSU ) /(kU ? k R ) (5.038e ? 7 ? 4.763e ? 7) /(7 ? 3) ? ? 0.462 RSSU /(n ? kU ? 1) (4.763e ? 7) /(40 ? 8)显然,在 H0 假设下,上述统计量服从 F 分布,在 5%的显著性水平下,自由度为(4,32) 的 F 分布的临界值为 2.67。显然,计算的 F 值小于临界值,我们不能拒绝 H0,所以β i(i=1,5,6,7)是联合不显著的。 (3)模型 D 中的 3 个解释变量全部通过了 10%水平下的显著性检验。尽管 R2 较小,残 差平方和较大,但相对来说其 AIC 值最低,所以我们选择该模型为最优的模型。 (4)预期 ?3 ? 0 , ? 4 ? 0 , ? 2 ? 0 ,因为随着收入的增加;随着人口的增加,住房需 求也会随之增加;随着房屋价格的上升,住房需求减少。回归结果与直觉相符,最 优模型中参数估计值的符号为正确符号。七、上机练习题1、经研究发现,学生用于购买书籍及课外读物的支出与本人受教育年限和其家庭收入水平 有关,对 18 名学生进行调查的统计资料如下表所示: 序号 1 2 3 4 购买书籍支出 Y (元/年) 450.5 507.7 613.9 563.4 受教育年限 X 1 (年) 4 4 5 4 家庭可支配收入 X 2 (元/月) 171.2 174.2 204.3 218.731 5 6 7 8 9 10 11 12 13 14 15 16 17 18501.5 781.5 541.8 611.1 .2 660.8 792.7 580.8 612.7 890.8 4.2 1253.04 7 4 5 10 7 5 6 4 5 7 9 8 10219.4 240.4 273.5 294.8 330.2 333.1 366.0 350.9 357.9 359.0 371.9 435.3 523.9 604.1要求: (1)试求出学生购买书籍及课外读物的支出 Y 与受教育年限 X 1 和家庭收入水平? X 2 的估计的回归方程: Y? ?? ? X ?? ? X ?? 0 1 1 2 22(2)对 ?1 , ? 2 的显著性进行 t 检验;计算 R 和 R ; (3)假设有一学生的受教育年限 X 1 ? 10 年,家庭收入水平 X 2 ? 480元/月,试预 测该学生全年购买书籍及课外读物的支出,并求出相应的预测区间( α =0.05) 。22、下表列出了某地区家庭人均鸡肉年消费量 Y 与家庭月平均收入 X,鸡肉价格 P1,猪肉价 格 P2 与牛肉价格 P3 的相关数据。鸡肉家庭人 均年消费量家庭月平 均收入鸡肉价格猪肉价格牛肉价格(元/公斤) (元/公斤) (元/公斤)32 (公斤)(元)Y 82 85 88 91 94 97 00 .78 2.99 2.98 3.08 3.12 3.33 3.56 3.64 3.67 3.84 4.04 4.03 4.18 4.04 4.07 4.01 4.27 4.41 4.67 5.06 5.01 5.17 5.29X 397 413 439 459 492 528 560 624 666 717 768 843 911 931 49 59 78P14.22 3.81 4.03 3.95 3.73 3.81 3.93 3.78 3.84 4.01 3.86 3.98 3.97 5.21 4.89 5.83 5.79 5.67 6.37 6.16 5.89 6.64 7.04P25.07 5.2 5.4 5.53 5.47 6.37 6.98 6.59 6.45 7 7.32 6.78 7.91 9.54 9.42 12.35 12.99 11.76 13.09 12.98 12.8 14.1 16.82P37.83 7.92 7.92 7.92 7.74 8.02 8.04 8.39 8.55 9.37 10.61 10.48 11.4 12.41 12.76 14.29 14.36 13.92 16.55 20.33 21.96 22.16 23.26(1)求出该地区关于家庭鸡肉消费需求的如下模型:ln Y ? ?0 ? ?1 ln X ? ?2 ln P 1 ? ?3 ln P 2 ? ?4 ln P 3 ??(2)请分析,鸡肉的基廷消费需求是否受猪肉及牛肉价格的影响?第三章一、名词解释多元线性回归模型1、 多元线性回归模型: 在现实经济活动中往往存在一个变量受到其他多个变量影响的现象, 表现在线性回归模型中有多个解释变量,这样的模型被称做多元线性回归模型,多元是指33 多个解释变量 2、调整的可决系数 R 2 :又叫调整的决定系数,是一个用于描述多个解释变量对被解释变 量的联合影响程度的统计量,克服了 R 2 随解释变量的增加而增大的缺陷,与 R 2 的关系 为 R ? 1 ? (1 ? R )2 2n ?1 。 n ? k ?13、偏回归系数:在多元回归模型中,每一个解释变量前的参数即为偏回归系数,它测度了 当其他解释变量保持不变时,该变量增加 1 单位对被解释变量带来的平均影响程度。 4、正规方程组:采用 OLS 方法估计线性回归模型时,对残差平方和关于各参数求偏导,并? ? X? 令偏导数为 0 后得到的方程组,其矩阵形式为 X ? X? Y。5、方程显著性检验:是针对所有解释变量对被解释变量的联合影响是否显著所作的检验, 旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出判断。二、单项选择题 1、C 2、A 3、B 4、A 5、 C 6、C 7、A 8、D 9、B 10、D三、多项选择题 1、ACDE 2、BD 3、BCD 4、BC 5、AD四、判断题、 1、√ 2、√ 3、× 4、× 5、√五、简答题 1、 答: 多元线性回归模型与一元线性回归模型的区别表现在如下几个方面:一是解释变量 的个数不同;二是模型的经典假设不同,多元线性回归模型比一元线性回归模型多了个 “解释变量之间不存在线性相关关系”的假定;三是多元线性回归模型的参数估计式的 表达更为复杂。2、 答: 在满足经典假设的条件下,参数的最小二乘估计量具有线性性、无偏性以及最小性 方差,所以被称为最优线性无偏估计量(BLUE) 对于多元线性回归最小二乘估计的正规方程组,能解出唯一的参数估计量的条件是 ( X? X )-1 存在,或者说各解释变量间不完全线性相关。34 六、计算分析题六、上机练习题 1、解: (1)(2)使用 Eviews 软件的计算结果如表所示 Dependent Variable: Y Variable X1 X2 C R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient 104.19 -0.....27 -89.395 Std. Error 6...32236 t-Statistic 16.776 -0.032173 Prob. 0 0.8 755.15 258.84 10.3 0Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)可见学生购买课外书籍与其受教育年限及家庭收入水平有如下具体关系:Y ? ?0.9756 ? 104.315X1 ? 0.402 X 2(-0.032) (16.276) (3.457)R 2 =0.979 7,R 2 =0.977 0,F =362.44(3)将 X 1 =10, X 2 =480 代入回归方程,可得 Y= ?0.9756 ? 104.315 ×10 ?0.402 ×480=1235.13(元)? 0...0007780 ? ? ? (X'X)-1 = ? ?0...0003455 ? ? ?0...0000088 ? ?0 =(1 10 480 ) ? 因此,取 X ,Y 均值的预测的标准差为由于? 2 X 0 ( X ' X ) ?1 X 0 ' = SY? ? ?023063.27 ? 0.2661 = 409.14 =20.23 18 ? 2 ? 1在 5%的显著性水平下,自由度为 18-2-1=15 的 t 分布的临界值为 t0.025 (15) ? 2.131 , 于是 Y 均值的 95%的预测区间为 1235.13 ? 2.131×20.23 同样容易得到 Y 个值得预测的标准差为 或 (1192.02 , 1278.24)35 ? 2 [1 ? X 0 ( X ' X )?1 X 0 '] = SY? ? ?023063.27 ? 1.2661 = .12 18 ? 2 ? 1或 (1141.11 , 1329.14)于是,Y 个值的 95%的预测区间为 1235.13 ? 2.131×44.122、解: (1)Eviews 软件回归结果如表所示。 Dependent Variable: LOG(Y) Variable LOG(P1) LOG(P2) LOG(P3) LOG(X) C R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient -0.....474 0....82 Std. Error 0.....296947 t-Statistic -4..137 4..463467 Prob. 0.3 0.6 0.301 0....2633 0Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)? ? ?0.7315 ? 0.3453InX ? 0.5021InP ? 0.1469InP ? 0.0872 InP InY 1 2 3(-2.463)(4.182) (-4.569)2(1.483)(0.873)R =0.9786 , F =252.26 , RSS =0.0135容易验证,家庭收入水平与鸡肉的价格对鸡肉的消费需求有显著的影响,而猪肉价 格及牛肉价格对鸡肉的消费影响不显著,尤其是牛肉价格的影响很小。但方程总体的线 性关系是显著的。(2) 那么是否猪肉价格与牛肉价格真的对鸡肉的消费需求没有影响呢?可检验如下原假设:H 0 : ?3 = ?4 =0对 Y 关于 X , P1 做回归得到下表所示的结果。 Dependent Variable: LOG(Y) Variable LOG(X) LOG(P1) Coefficient 0..37273536Std. Error 0..063104t-Statistic 18.3668Prob. 0 0 C R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat-1......7060.08842-12.732370 1.....2843 0Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)? ? ?1.1258 ? 0.4515InX ? 0.3727InP InY 1(-12.73) (18.39) (-5.91)R 2 =0.9783 , F =497.28, RSS =0.0153为了检验原假设,求如下的 F 统计量:F? ?( RSS R ? RSSU ) / 2 RSSU /(23 ? 4 ? 1)(0.0153 ? 0.0135) / 2 0.0135/18 ? 1.2在 5%的显著性水平下, 自由度为 (2, 18) 的 F 分布的临界值为 F0.05 (2,18) =3.55,因此, 没有理由拒绝原假设,即该地区猪肉与牛肉价格确实对家庭的鸡肉消费需求不产生显著影 响。37 第四章二、单项选择题随机解释变量问题1、如果模型包含随机解释变量,且与随机干扰项异期相关,则普通最小二乘估 计量是 A、无偏估计量 C、一致估计量 B、有效估计量 D、最佳线性无偏估计量 ( )2、假设回归模型 Yi ? ?0 ? ?1 X i ? ?i ,其中 X i 为随机变量, X i 与 ? i 相关,则 ? 的普通最 小二乘估计量 A、无偏且一致 C、有偏但一致 B、无偏但不一致 D、有偏且不一致 ( ) ( )3、 随机解释变量问题分为三种情况, 下列哪一种不是 A、随机解释变量与随机干扰项不相关 B、随机解释变量与随机干扰项同期不相关,不同期相关 C、随机解释变量与随机干扰项同期相关 D、随机解释变量与随机干扰项高度相关 4、 当解释变量中包含随机被解释变量时, 下面哪一种情况不可能出现 A、参数估计量无偏 C、参数估计量有偏 B、参数估计量渐进无偏()D、随机误差项的自相关问题仍可用 D-W 检验 ( )5、 在工具变量的选取中, 下面哪一个条件不是必须的 A、与所替代的随机解释变量高度相关 B、与随机干扰项不相关 C、与模型中的其他解释变量不相关 D、与被解释变量存在因果关系三、判断题1、 含有随机解释变量的线性回归模型, 其普通最小二乘法估计量都是有偏的 2、 工具变量替代随机变量后, 实际上是工具变量变为了解释变量 ( ( ) )3、当随机解释变量与随机干扰项同期相关时,如果仍用最小二乘法估计,则估计量有偏且 非一致。 ( )四、简答题? 是 ? 的一 什么是估计的一致性?试通过一元模型证明对于工具变量法的斜率的估计量 ? 1 1致估计。38 五、计算分析题1、一个研究对某地区大学生就业的影响的简单模型可描述如下EMP t ? ?0 ? ?1MIN1t ? ? 2 POP t ? ?3GDP 1t ? ? 4GDP t ? ?t式中,EMP 为新就业的大学生人数,MIN1 为该地区最低限度工资,POP 为新毕业的大 学生人数,GDP1 为该地区国内生产总值,GDP 为该国国内生产总值。 (1) 如果该地区政府以多多少少不易观测的却对新毕业大学生就业有影响的因素作为基 础来选择最低限度工资,则 OLS 估计将会存在什么问题? (2)令 MIN 为该国的最低限度工资,它与随机扰动项相关吗? (3)按照法律,各地区最低限度工资不得低于国家最低工资,那么 MIN 能成为 MIN1 的工具变量吗? 解: (1)由于地方政府往往是根据过去的经验、当前的经济状况以及期望的经济发展前景来 定制地区最低限度工资水平的,而这些因素没有反映在上述模型中,而是被归结到了模型的 随机扰动项中,因此 MIN1 与 ? 不仅异期相关,而且往往是同期相关的,这将引起 OLS 估 计量的偏误,甚至当样本容量增大时也不具有一致性。 (2)全国最低限度的制定主要根据全国国整体的情况而定,因此 MIN 基本与上述模型 的随机扰动项无关。 (3)由于地方政府在制定本地区最低工资水平时往往考虑全国的最低工资水平的要求, 因此 MIN1 与 MIN 具有较强的相关性。结合(2)知 MIN 可以作为 MIN1 的工具变量使 用。六、上机练习题1、某国的政府税收 T(单位:百万美元) ,国内生产总值 GDP(单位:10 亿美元)和汽车39 数量 Z (单位: 百万辆) 的观测数据如下表所示。 试以汽车数量 Z 作为国内生产总值 GDP 的工具变量,估计税收函数:Tt ? ?0 ? ?1 ? GDP t ? ?t序号 1 2 3 4 5 T 3 2 5 6 4 GDP 4 1 7 8 5 Z 5 2 6 7 5 序号 6 7 8 9 T 5 7 9 8 GDP 7 8 11 10 Z 6 6 7 72、下表国内生产总值 GDP、消费 CS,投资 IV 的样本观测值,试以投资 IV 作为国内生产 总值 GDP 的工具变量,估计消费 CS 关于国内生产总值 GDP 的函数:ln Cst ? ?0 ? ?1 ln GDP t ? ?t时间 83 86 89 92 CS 7.9 4.5 7.0 3.1 3.2 59.8 GDP 1.0 02.2 28.3 47.9 38.1 1.0 IV 3.2 5.6 8.0 4.0 2.0 7.0 时间 95 98 01 04 CS 09.8 52.3 21.1 95.6 81.6 94.5 GDP 59.4 84.6 45.2 68.1 172.3
IV 56.3 36.1 30.8 23.8 18.3 51.440 第四章 随机解释变量问题一、名词解释 1、随机解释变量:指在现实经济现象中,解释变量不是可控的,即解释变量的观测值具有 随机性,并且与模型的随机干扰项可能有相关关系,这样的解释变量称为随机解释变量 2、工具变量:顾名思义是在模型估计过程中被作为工具使用的变量,用以替代与随机干扰 项相关的随机解释变量。二、单项选择题 1、C 2、D 3、D 4、D 5、D三、判断题 1、× 2、× 3、√四、简答题 估计的一致性是指,随着样本容量的增加,即使当 n ?? 时,参数估计量依概率收敛于 参数的真值,即有: P lim(?n ) ? ???对 于 一 元 线 性回 归 模 型: Yt ? ?0 ? ?1 X t ? ?t , 在 第 二 章曾 得 如 下最 小 二 乘 估 计量 :? ?? ? 1?xxt yt2 t? ?1 ??x ? ?xt 2 tt,如果 X t 和?t 同期相关,则估计量有偏且不一致,这时需要用一个与 X t 高度相关而与 ?t 同期无关的工具变量 Zt 来代替 X t 进行 OLS 估计, 这就是所谓的? ? 工具变量法。这时正规方程组易得: ? 1P lim?z y ?z xii? ?1 ?i i?z ? ?z xii,两边取概率极限得:i i1 ? zi ?i Cov( Zt , ?t ) n ? ) ?? ? ? P lim( ? ? ?1 ? ? ?1 1 1 1 Cov ( Z , X ) t t P lim ? zi xi n六、上机练习题 1、解:用EViews软件得如下结果: Dependent Variable: T41 Method: Two-Stage Least Squares Date: 05/16/08 Sample: 1 9 Included observations: 9 Instrument list: Z Variable C GDP R-squared Adjusted R-squared S.E. of regression F-statistic Prob(F-statistic) Coefficient 0......044 Std. Error 0..074876 t-Statistic 1..944499 Prob. 0.0 5....605439 Time: 21:58Mean dependent var S.D. dependent var Sum squared resid Durbin-Watson stat由此可知税收函数的估计结果为: T=0.7GDP (1.65) R2=0.9387 F=80.00 (8.94) D.W.=1.605? ? ?1.3281 ? 1.056 ln GDP 2、得到消费函数估计方程为: ln Cs t t (?1.37)2(11.29)R ? 0.8287 F ? 127.55 D.W . ? 1.17Dependent Variable: LOG(CS) Method: Two-Stage Least Squares Date: 07/01/08 Time: 13:08Sample:
Included observations: 24 Instrument list: LOG(IV) Variable C LOG(GDP) R-squared Adjusted R-squared S.E. of regression F-statistic Coefficient -1......5541 Std. Error 0..093542 t-Statistic -1..29399 Prob. 0.0 9....168711Mean dependent var S.D. dependent var Sum squared resid Durbin-Watson stat42 Prob(F-statistic)0.000000第五章二、单项选择题多重共线性1、在线性回归模型中,若解释变量 X 1 和 X 2 的观测值成比例,既有 X1i ? kX 2i ,其中 k 为 非零常数, 则表明模型中存在 A、异方差 C、序列相关 B、多重共线性 D、随机解释变量 ( )? 的方差 2、对于模型 Yi ? ?0 ? ?1 X1i ? ?2 X 2i ? ?i ,与 r12=0 相比,当 r12=0.15 时,估计量 ? 1? ) 将是原来的 Var (? 1A、1 倍 B、1.023 倍 C、1.96 倍 ) 问题是严重的 B、序列相关问题 D、解释变量与随机项的相关性 D、2 倍 3、 如果方差膨胀因子 VIF=15, 则认为 ( A、异方差问题 C、多重共线性问题 4、 一般多重共线性下参数估计量 A、不存在 C、唯一 5、 完全多重共线性下参数估计量 A、唯一 C、不存在 6、下列方法中,可克服多重共线性的是 A、差分法 C、工具变量法 B、加权最小二乘法 D、广义最小二乘法 B、有无穷多解 D、有效 B、有无穷多解 D、非有效()()()()()三、多项选择题1、 多重共线性产生的主要原因有 A、经济变量之间往往存在同方向的变化趋势 B、经济变量之间往往存在密切的关联度 C、在模型中采用滞后变量也容易产生多重共线性 D、在建模过程中由于解释变量选择不当,引起了变量之间的多重共线性 E、以上都不正确 2、 检验多重共线性严重性的方法有 ( ) ( )43 A、等级相关系数法 C、工具变量法 E、逐步回归法B、方差膨胀因子 D、判定系数检验法3、 当模型中解释变量间存在高度的多重共线性时 A、各个解释变量对被解释变量的影响将难于精确鉴别 B、部分解释变量与随机干扰项之间将高度相关 C、估计量的精确度大幅下降 D、估计量对于样本容量的变动将十分敏感 E、模型的随机误差项也将序列相关 4、 多重共线性解决方法主要有 A、保留重要的解释变量,去掉次要的或可替代的解释变量 B、利用先验信息改变参数的约束形式 C、变换模型的形式 D、综合使用时间数据与截面数据 E、逐步回归法以及增加样本容量()()四、判断题1、当用于检验方程线性显著性的 F 统计量与检验单个系数显著性的 t 统计量结果矛盾时, 可以认为出现了严重的多重共线性 2、 当存在严重的多重共线性时, 普通最小二乘法往往会低估参数估计量的方差 ( ( ) )3、变量的两两高度相关并不表示高度多重共线性,变量不存在两两高度相关表示不存在高 度多重共线性 ( )4、由于多重共线性不会影响到随机干扰项的方差,因此如果分析的目的仅仅是预测,则多 重共线性是无害的 ( )五、计算分析题1、某地区供水部门利用最近 15 年的用水年度数据得出如下估计模型:water ? ?326.9 ? 0.305house? 0.363pop ? 0.005pcy ? 17.87 price ? 1.123rain(-1.7) (0.9)2(1.4)(-0.6) F=38.9(-1.2)(-0.8)R ? 0.93式中, water――用水总量 (百万立方米) ,house――住户总数 (千户) ,pop――总人口 (千 人),pcy――人均收入(元),price――价格(元/100 立方米),rain――降雨量(毫米) 。 (1)根据经济理论和直觉,请估计回归系数的符号的正负(不包括常量),为什么?观察符 号与你的直觉相符吗?44 (2)在 5%的显著性水平下,请进行变量的 t-检验与方程的 F-检验。T 检验与 F 检验结果 有相矛盾的现象吗? (3)你认为估计值是有偏的、无效的、或不一致的吗?详细阐述理由。 1、解: (1)在其他变量不变的情况下,一城市的人口越多或房屋数量越多,则对用水的需求越 高。所以可期望 house 和 pop 的符号为正;收入较高的个人可能用水较多,因此 pcy 的 预期符号为正,但它可能是不显著的。如果水价上涨,则用户会节约用水,所以可预期 price 的系数为负。 显然如果降雨量较大, 则草地和其他花园或耕地的用水需求就会下降, 所以可以期望 rain 的系数符号为负。从估计的模型看,除了 pcy 之外,所有符号都与预 期相符。 (2)t-统计量检验单个变量的显著性,F-统计值检验变量是否是联合显著的。 这里 t-检验的自由度为 15-5-1=9,在 5%的显著性水平下的临界值为 2.262。可见, 所有参数估计值的 t 值的绝对值都小于该值, 所以即使在 5%的水平下这些变量也不是显 著的。 这里,F-统计值的分子自由度为 5,分母自由度为 9。5%显著性水平下 F 分布的临 界值为 3.45。可见计算的 F 值大于该临界值,表明回归系数是联合显著的。 T 检验与 F 检验结果的矛盾可能是由于多重共线性造成的。house、pop、pcy 是高度 相关的,这将使它们的 t-值降低且表现为不显著。price 和 rain 不显著另有原因。根据经 验,如果一个变量的值在样本期间没有很大的变化,则它对被解释变量的影响就不能够 很好地被度量。可以预期水价与年降雨量在各年中一般没有太大的变化,所以它们的影 响很难度量。 (3)多重共线性往往表现的是解释变量间的样本观察现象,在不存在完全共线性的情况 下,近似共线并不意味着基本假定的任何改变,所以 OLS 估计量的无偏性、一致性和有 效性仍然成立,即仍是 BLUE 估计量。但共线性往往导致参数估计值的方差大于不存在 多重共线性的情况。45 六、上机练习题1、下表是某种商品的需求量、价格以及消费者收入的统计资料:年份 需求量 Y 价格 X1 收入 X2 1 3.5 16 15 2 4.3 13 20 3 5.0 10 30 4 6.0 7 42 5 7.0 7 50 6 9.0 5 54 7 8.0 4 65 8 10 3 72 9 12 3.5 85 10 14 2 90要求: (1)检验 X1 和 X2 是否存在严重的多重共线性? (2)如何解决或减轻多重共线性的影响,并给出这一问题的回归方程。2、下表是被解释变量 Y 及解释变量 X1、X2、X3、X4 的时间序列观测值:Y X1 X2 X3 X4 6.0 40.1 5.5 108 63 6.0 40.3 4.7 94 72 6.5 47.5 5.2 108 86 7.1 49.2 6.8 100 100 7.2 52.3 7.3 99 107 7.6 58.0 8.7 99 111 8.0 61.3 10.2 101 114 9.0 62.5 14.1 97 116 9.0 64.7 17.1 93 119 9.3 66.8 21.3 102 121要求: (1)用 OLS 法估计线性回归模型 (2)采用适当的方法检验多重共线性;第五章一、名词解释多重共线性1、多重共线性:指两个或两个以上解释变量之间存在某种线性相关关系。 2、不完全多重共线性:在实际经济活动中,多个解释变量之间存在多重共线性问题,但解 释变量之间的线性关系是近似的,而不是完全的二、单项选择题 1、B 2、B 3、C 4、C 5、B 6、A三、多项选择题 1、ABCD 2、BDE 3、ACD 4、ABCDE46 四、判断题 1、√ 2、× 3、× 4、×五、计算分析题 六、上机练习题 1、解: (1)设模型的函数形式为Y ? ?0 ? ?1 X1 ? ?2 X 2 ? ?OLS 估计如下表所示。 Dependent Variable: Y Included observations: 10 Variable C X1 X2 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient -1.......126 2.641746 Std. Error 3...033114 t-Statistic -0...850684 Prob. 0.3 0. 3....027Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)从 F 统计量的计算值看,F=67.04,该值大于 5%显著性水平下,自由度为(2,7)的 F 分布 的临界值 F0.05(2, 7) ? 4.74,表明模型从整体上看商品需求量与解释变量之间线性关系显 著。但由于商品价格前参数的估计值的 t 检验不显著,且为正数,违背经济意义,故怀疑两 解释变量之间存在较严重的多重共线性。 事实上, 容易验证两解释变量间的相关系数高达 r= -0.9427。说明模型中解释变量间确实存在共线性。 (2) 运用 OLS 方法逐一求 Y 对各个变量的回归, 然后结合经济意义和统计检验选出拟合效 果最好的线性回归模型。通过 EViews 软件,易得? ? 12.49 ? 0.6536 X Y 1(12.39) (-5.38). .? 0 . 7 2 1 R 2 ? 0.7836 F ? 2 8 . 9 7 DW ? ? 1.2179 ? 0.1274 X Y2(1.89) (11.44)R 2 ? 0.9423F ? 1 3 0 . 7 6 DW . . ? 1.95847 从这两个回归结果看,第二个方程要比第一个方程好,故可选择第二个方程为最终模型。2、解: (1)用 OLS 法估计如下表: Dependent Variable: Y Method: Least Squares Date: 05/17/08 Sample: 1 10 Included observations: 10 Variable C X1 X2 X3 X4 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat2Time: 20:39Coefficient 3...........213879Std. Error 1.....017612t-Statistic 2.....420498Prob. 0.1 0.0 0.000 1....204Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)有上述估计可以知 R =0.9797,说明四个 X 总体上对 Y 构成线性影响。F=60.19,大于 5%的显著性水平下容量为(4,5)的 F 分布的临界值 15.52,再次判断 Y 与上述解释变量间 的总体线性关系显著成立。但由于 X3,X4 参数估计值未能通过 t 检验,故认为解释变量间可 能存在多重共线性。 事实上,可以验证,X1 与其他解释变量间有下表所示的回归结果: Dependent Variable: X1 Method: Least Squares Date: 05/17/08 Sample: 1 10 Included observations: 10 Variable C X2 Coefficient 1..62618948Time: 20:47Std. Error 16.727t-Statistic 0..445763Prob. 0.7 X3 X4 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat0......825 1.2987440..0523470..5090980.6 54.863 4...045Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)由拟和优度可知,X1 与其他解释变量间高度线性相关。第六章一、名词解释1、异方差性异方差性2、广义最小二乘法二、单项选择题1、 Gleiser 检验法主要用于检验 A、异方差性 C、随机解释变量 2、 Goldfeld-Quandt 检验法可用于检验 A、异方差性 C、序列相关 B、多重共线性 D、设定误差 ( ) B、自相关性 D、多重共线性 ( ) ( )3、 若回归模型中的随机误差项存在异方差性, 则估计模型参数应采用 A、普通最小二乘法 C、广义差分法 B、加权最小二乘法 D、工具变量法4、 如果回归模型中的随机误差项存在异方差, 则模型参数的普通最小二乘估计量 A、无偏且有效 C、有偏但有效 B、无偏但非有效 D、有偏且非有效()5、 设回归模型为 Yi ? ? X i ? ?i , 其中 Var (?i ) ? ? 2 X i , 则 ? 的最有效估计量为()49 ?? A、 ??? C、 ?? XY ?X2?? B、 ??? D、 ?n? XY ? ? X ?Y n? X 2 ? (? X )21 X ? n Y( )Y X6、对于模型 Yi ? ?0 ? ? X i ? ?i ,如果在异方差检验中发现 Var (?i ) ? ? 2 X i , 则用加权最小二乘法估计模型参数时, 权数应为A、XiB、Xi1 X C、 iD、1 Xi三、多项选择题1、 下列哪些方法可克服异方差性 A、差分法 C、工具变量法 2、 异方差性的后果包括 A、参数估计量不再满足无偏性 B、变量的显著性检验失去意义 C、模型的预测失效 D、普通最小二乘法参数估计量方差较大 3、 下列计量经济分析中, 很可能存在异方差问题的有 A、用横截面数据建立家庭消费支出对家庭收入水平的回归模型 B、用横截面数据建立产出对劳动和资本的回归模型 C、以凯恩斯的有效需求理论为基础构造宏观计量经济模型 D、以国民经济核算帐户为基础构造宏观计量经济模型 4、 异方差的检验方法有 A、图示检验法 B、Glejser 检验 C、white 检验 D、D.W. 检验 E、Goldfeld-Quandt 检验 ( ) ( ) B、加权最小二乘法 D、广义最小二乘法 ( ) ( )四、判断题1、 存在异方差情况下, 普通最小二乘估计量依然是无偏和有效的。 2、 如果存在异方差, 通常使用的 t 检验和 F 检验无效。 3、 如果 OLS 法估计的残差呈现系统模式, 则意味着存在着异方差。 4、 广义最小二乘法可消除异方差。 5、 存在异方差时, 普通最小二乘法通常会高估参数估计量的方差50( ( ( ( () ) ) ) ) 6、Goldfeld-Quandt 检验异方差时,排序后去掉中间 c 个变量,c 值越大,检验就越高,但 过高的 c, 会降低检验的自由度, 因而 c 应该适量, 近似为样本容量的 1/4。 ( )五、简答题1、简述异方差对 OLS 估计量的性质、置信区间、显著性 t 检验和 F 检验有何影响。2、下列哪种情况是异方差性造成的结果? (1)OLS 估计量是有偏的 (2)通常的变量显著性检验的 t 统计量不再服从 t 分布。 (3)OLS 估计量不再具有最佳线性无偏性。3、已知线性回归模型:yi ? ?0 ? ?1 x1i ? ?2 x2i ? ?i存在异方差性,随机误差项的方差为 ? ?i ? 2x1i ? 3 ,问参数估计时,如何克服该异方差性2的影响?六、计算分析题1、已知模型Yi ? ? 0 ? ?1 X 1i ? ? 2 X 2i ? ui式中, Yi 为某公司在第 i 个地区的销售额; X 1i 为该地区的总收入; X 2 i 为该公司在该 地区投入的广告费用(i=0,1,2??,50) 。 (1)由于不同地区人口规模 Pi 可能影响着该公司在该地区的销售,因此有理由怀疑随机 误差项ui 是异方差的。假设 ? i 依赖于 Pi ,请逐步描述你如何对此进行检验。需说51 明:a、假设和备择假设; b、要进行的回归; c、要计算的检验统计值及它的分布 (包括自由度) ; d、接受或拒绝零假设的标准。 (2)假设 ? i ? ?Pi 。逐步描述如何求得 BLUE 并给出理论依据。 1、 (1)如果 ? i 依赖于总体 Pi 的容量,则随机扰动项的方差 ? i2 依赖于 Pi 2 。因此,要进行的2 回归的一种形式为 ? i2 ? ? 0 ? ?1 P i ? ? i 。于是,要检验的零假设 H0: ?1 ? 0 ,备择假设H1: ?1 ? 0 。检验步骤如下:~2 ; 第一步:使用 OLS 方法估计模型,并保存残差平方项 e i ~ 对常数项 C 和 P 2 的回归 第二步:做 e i i2第三步:考察估计的参数 ?1 的 t 统计量,它在零假设下服从自由度为 n-2 的 t 分布。 第四步:给定显著性水平面 0.05(或其他) ,查相应的自由度为 n-2 的 t 分布的临界值,?1 的 t 统计值大于该临界值,则拒绝同方差的零假设。 如果估计的参数 ?(2)假设 ? i ? ?Pi 时,模型除以 Pi 有:Yi X X u 1 ? ? 0 ? ?1 1i ? ? 2 2i ? i Pi Pi Pi Pi Pi由于 Var(ui / Pi ) ? ? i2 / Pi 2 ? ? 2 ,所以在该变换模型中可以使用 OLS 方法,得出 BLUE 估 计值。方法是对 Yi / Pi 关于 1 / Pi 、 X 1i / Pi 、 X 2i / Pi 做回归,不包括常数项。2、已知模型 Yt ? ?0 ? ?1 X1t ? ?2 X 2t ? ?t , Var (?t ) ? ? ? ? Zt ,其中 Y,X1,X2 和 Z2 2 2的数据已知。假定给定权数 wt ,加权最小二乘法就是使 (1)求 RSS 对 ? 0 , ?1 和 ? 2 的偏微分并写出正规方程。 (2)用 Z 去除远模型,写出所得新模型的正规方程。 (3)把 wt ?2 RSS ? ?(wt ?t )2 ? ?(wY t t ? ?0 w t ? ?1w t X1t ? ?2 w t X 2t ) 最小。1 带入(1)中的正规方程,并证明它们和在(2)中推导的结果一样。 Zt2、 (1)由 RSS ??(w ? ) ? ?(wY ? ? w ? ? w X2 t t t t 0 t 1 t1t? ?2wt X 2t )2 对各 ? 求偏导并令值为零,可得如下正规方程组:? (w Y ? w ? w X ? (w Y ? w ? w X ? (w Y ? w ? w Xt t t t t t t t t t t t1t 1t 1t? wt X 2t )wt ? 0 ? wt X 2t )wt X 1t ? 0 ? wt X 2t )wt X 2t ? 0(2)用 Z 去除原模型,得如下新模型:52 ?(Z ?(Z ?(Z(3)如果用Ytt? ? ??0Zt? ?1 ? ?1 ? ?1X 1t X 1 ? ? 2 2t ) ? 0 Zt Zt Zt X 1t X X ? ? 2 2t ) 1t ? 0 Zt Zt Zt X 1t X X ? ? 2 2t ) 2t ? 0 Zt Zt ZtYtt?0ZtYtt?0Zt1 代替(1)中的 wt ,则容易看到与(2)中的正规方程组是一样的。 Zt七、上机分析题下表给出了美国 18 个行业 1988 年研究开发(R&D)费用 Y 和销售收入 X 的数据,请用 Park 检验,Gleiser 检验,Goldfeld-Quandt 检验与 White 检验来检验 Y 关于 X 的回归模 型是否存在异方差性?如果存在请尝试消除它。 序号 1 2 3 4 5 6 7 8 9 研究开发费用 Y 62.5 92.9 178.3 258.4 494.7 0.6 421.7 509.2 销售收入 X 26.4 69.2 05.6 95.4 70761.6 序号 10 11 12 13 14 15 16 17 18 研究开发费用 Y 8.6 7.5 3.8 3.8 9528.2 销售收入 X 94.0
第六章 异方差性53 一、名词解释 1、异方差性:指对于不同的样本值,随机干扰项的方差不再是常数,而是互不相同的。 2、广义最小二乘法: (GLS)是最具有普遍意义的最小二乘法,可用来处理模型存在异方差 或序列相关时的估计问题二、单项选择题 1、A 2、A 3、B 4、B 5、C 6、D三、多项选择题 1、BD 2、BC 3、AB 4、ABCE四、判断题 1、× 2、√ 3、√ 4、√ 5、× 6、×五、简答题 1、OLS 估计量仍是线性无偏的,但不再具有最小方差,即不再有效;大样本情况下,具有 一致性,但不具有渐近有效性。由于相应的置信区间和 t 检验、F 检验都与估计量的方差相 关,因此会造成建立的置信区间以及 t 检验与 F 检验都不再是可靠的。 2、3、第(2)与(3)种情况可能由于异方差性造成。异方差性并不会影响 OLS 估计量无 偏性。 3、解:在模型的左右两边同时乘以1 ,使模型化为 2 x1i ? 3yi ?0 ?1 x1i ?2 x2i ?i ? ? ? ? 2 x1i ? 3 2 x1i ? 3 2 x1i ? 3 2 x1i ? 3 2 x1i ? 3六、上机练习题 Eviews 软件中 Y 关

我要回帖

更多关于 计量经济学 的文章

 

随机推荐