统计分析中因素分析法的计算公式通常需要分析哪些因素

关于PM_(2.5)影响因素的统计分析--《燕山大学》2014年硕士论文
关于PM_(2.5)影响因素的统计分析
【摘要】:近年来,我国的空气污染问题越来越严重,不良空气质量带来的各种问题也是日益受到人们的重视,在这样的背景下,PM2.5已经从一个专业术语变成了众所周知的普通名词,关于PM2.5的监测和治理进行的讨论成为了当今社会的重要话题之一。
本文一共分为五个部分。首先介绍了研究的背景和意义,叙述了PM2.5的危害和国内外的研究现状,介绍了计量经济学和正交试验设计的研究现状,并对本文用到的研究内容和方法进行了概述。第二部分对文中用到的计量经济学和正交试验设计的相关知识进行了讲解,分析了文中模型的相关理论基础。在第三部分中,首先选取了影响PM2.5浓度大小的相关影响因素,对这些因素进行分析之后建立数学模型,然后查找数据并通过SAS软件对方程进行拟合,最后检验异方差性、序列相关性以证明所拟合方程的可用性。在文中的第四部分,选取了3个城市的3组数据来作为各因素水平,再选取正交表安排试验将各数据代入到拟合的方程求出PM2.5数值,之后通过正交试验设计的直观分析法确定因素水平的最优组合方案,然后通过用正交试验设计的方差分析法讨论因素的显著性,最后再用效应估计的方法研究各因素处于什么水平时能使PM2.5浓度达到最低。文中的最后一个部分,也就是结论,对论文的整体研究做了一个总结,并根据得出的结果对如何降低PM2.5的浓度大小给出了几点建议。
【关键词】:
【学位授予单位】:燕山大学【学位级别】:硕士【学位授予年份】:2014【分类号】:X513【目录】:
摘要5-6Abstract6-9第1章 绪论9-18 1.1 研究的背景和意义9-12
1.1.1 本文的研究背景9-11
1.1.2 本文的选题意义11-12 1.2 国内外研究现状12-16
1.2.1 PM_(2.5)研究现状12-13
1.2.2 SAS 系统的研究现状13-14
1.2.3 计量经济学研究现状14-15
1.2.4 正交试验设计研究现状15-16 1.3 本文的研究内容与研究方法16-18
1.3.1 本文的研究内容16
1.3.2 本文的研究方法16-18第2章 模型相关理论基础18-26 2.1 多元回归分析与回归诊断18-21
2.1.1 回归分析模型18-20
2.1.2 回归诊断20-21 2.2 正交试验设计21-26
2.2.1 正交表介绍22-24
2.2.2 正交实验设计的基本步骤24-26第3章 方程拟合以及计量经济学检验26-35 3.1 引言26 3.2 方程的拟合26-29
3.2.1 选取解释变量26
3.2.2 建立数学模型26-27
3.2.3 选取数据27-28
3.2.4 拟合方程28-29 3.3 计量经济学检验29-34
3.3.1 异方差性检验29-31
3.3.2 序列相关性检验31-34 3.4 本章小结34-35第4章 正交试验设计分析35-50 4.1 引言35 4.2 直观分析35-40 4.3 方差分析40-46
4.3.1 各因素离差平方和43-44
4.3.2 总离差平方和44
4.3.3 试验误差的离差平方和44
4.3.4 自由度44-45
4.3.5 平均离差平方和45
4.3.6 F 值的计算45
4.3.7 方差分析表45-46 4.4 效应估计46-48 4.5 本章小结48-50结论50-51参考文献51-54攻读硕士学位期间承担的科研任务与主要成果54-55致谢55-56作者简介56
欢迎:、、)
支持CAJ、PDF文件格式
【参考文献】
中国期刊全文数据库
穆广杰,李晓峰;[J];平顶山工学院学报;2004年03期
李学彬;宫纯文;徐青山;魏合理;;[J];光学精密工程;2008年07期
刘燕;贺克斌;时宗波;陈雁菊;解明曙;;[J];环境保护科学;2006年05期
于娜;魏永杰;胡敏;曾立民;张远航;;[J];环境科学学报;2009年02期
李金娟;邵龙义;杨书申;;[J];环境与健康杂志;2006年02期
罗杜宇;夏琴香;;[J];精密成形工程;2010年02期
罗传义,时景荣,戴传波;[J];计算机工程;2002年11期
时宗波,邵龙义,T.P.Jones,A.G.Whittaker,R.J.Richards,张鹏飞;[J];科学通报;2004年07期
陈敏;;[J];红河学院学报;2011年04期
戴兵;罗向东;唱鹤鸣;;[J];南通大学学报(自然科学版);2006年04期
【共引文献】
中国期刊全文数据库
王峰云;阎凤霞;;[J];安徽农业科学;2010年09期
周德平;齐颖;甘露林;高杰;;[J];安徽农业科学;2010年15期
卜庆雷;王琪珍;陈传振;王承军;范永强;;[J];安徽农业科学;2010年35期
甘小凤;曹军骥;王启元;沈振兴;徐红梅;;[J];安徽农业科学;2011年19期
李致平;董梅生;;[J];安徽工业大学学报(社会科学版);2006年01期
黄聪敏;;[J];现代农业科技;2011年16期
秦华光;李家才;穆丹;胡强;黄毅;韩宝瑜;;[J];安徽农业大学学报;2008年04期
王宏全;孙晓梅;张守攻;赵鲲;焦云德;;[J];安徽农业大学学报;2010年04期
刘艳菊;李巍;郝芳华;;[J];安全与环境学报;2009年03期
陈文明,谢英秀,苏冬平,冯建生;[J];宝钢技术;2000年03期
中国重要会议论文全文数据库
徐薇;修光利;朱梦雅;张大年;;[A];上海市化学化工学会2011年度学术年会论文集[C];2011年
郭志武;;[A];中国医院协会病案管理专业委员会第十九届学术会议论文集[C];2010年
王开燕;王雪梅;唐建辉;朱建军;区建峰;张振清;;[A];第四届粤港澳可持续发展研讨会论文集[C];2008年
张宁;;[A];首届中国中西部地区色谱学术交流会暨仪器展览会论文集[C];2006年
黄德生;张世秋;万薇;余嘉玲;邹文博;陈晓兰;;[A];中国环境科学学会2009年学术年会论文集(第二卷)[C];2009年
黄德生;张世秋;万薇;余嘉玲;邹文博;陈晓兰;;[A];中国环境科学学会2009年学术年会论文集(第二卷)[C];2009年
蒋大和;;[A];2010中国环境科学学会学术年会论文集(第三卷)[C];2010年
洪盛茂;焦荔;何曦;包贞;孙鸿良;徐鸿;马万里;杨乐;何纪平;;[A];第五届海峡两岸气溶胶技术研讨会论文集[C];2008年
程穆宁;崔云霞;王燕枫;辛玉婷;;[A];中国毒理学会环境与生态毒理学专业委员会第二届学术研讨会暨中国环境科学学会环境标准与基准专业委员会2011年学术研讨会会议论文集[C];2011年
张小玲;徐晓峰;刘洁;李磊;;[A];中国气象学会2006年年会“大气成分与气候、环境变化”分会场论文集[C];2006年
中国博士学位论文全文数据库
李宝红;[D];中南大学;2011年
岑世宏;[D];中国矿业大学(北京);2011年
牛红亚;[D];中国矿业大学(北京);2011年
乔玉霜;[D];中国矿业大学(北京);2011年
刘爱东;[D];中国疾病预防控制中心;2011年
佘峰;[D];兰州大学;2011年
黄茶熙;[D];北京中医药大学;2012年
余红梅;[D];第四军医大学;2001年
邵长桥;[D];北京工业大学;2002年
郭静;[D];第四军医大学;2002年
中国硕士学位论文全文数据库
刘金波;[D];南京医科大学;2009年
刘文博;[D];长春工业大学;2010年
李清平;[D];浙江大学;2010年
张铸三;[D];中南林业科技大学;2010年
肖湘杰;[D];湖南农业大学;2010年
潘文燕;[D];东华大学;2011年
刘荣森;[D];塔里木大学;2011年
王贝贝;[D];山东师范大学;2011年
董希良;[D];山东建筑大学;2011年
周建淞;[D];山西医科大学;2011年
【二级参考文献】
中国期刊全文数据库
朱龙;;[J];安徽广播电视大学学报;2008年03期
张铮,孟广礼;[J];北京大学学报(自然科学版);1992年01期
郇宁;曾立民;邵敏;崔良;毛节泰;周楠;董华斌;俞仲英;罗志明;;[J];北京大学学报(自然科学版);2006年02期
张远航,邵可声,唐孝炎,李金龙;[J];北京大学学报(自然科学版);1998年Z1期
张金良,李艳宏,王燕玲,金昱,邓芙蓉,刘红,王昕,郭新彪;[J];北京大学学报(医学版);2001年06期
彭林,白志鹏,朱坦;[J];城市环境与城市生态;2003年03期
彭红,秦瑜;[J];大气科学;1992年05期
罗云峰,周秀骥,李维亮;[J];地球科学进展;1998年06期
夏琴香,阮锋,岛进,小寺秀俊,安福大辅;[J];锻压技术;2002年06期
夏琴香,阮锋;[J];锻压技术;2004年01期
中国重要会议论文全文数据库
吴兑;邓雪娇;毛伟康;叶燕翔;唐浩华;樊琦;万齐林;谢兴生;吕伟涛;张文煜;白延林;王美华;黄浩辉;李福娇;毛节泰;陶善昌;范绍佳;王安宇;;[A];新世纪气象科技创新与大气科学发展——中国气象学会2003年年会“地球气候和环境系统的探测与研究”分会论文集[C];2003年
【相似文献】
中国期刊全文数据库
高秋涛,毕开顺;[J];中国中药杂志;2004年12期
;[J];山东纺织科技动态;1973年09期
中国科学院数学研究所统计组;[J];数学的实践与认识;1974年02期
;[J];有色金属(冶炼部分);1974年08期
;[J];上海化工;1974年05期
东北工学院“正交试验设计”推广小组;[J];东北工学院学报;1975年01期
;[J];上海化工;1975年03期
;[J];上海化工;1975年06期
周湘芷;;[J];陶瓷;1975年04期
;[J];发酵科技通讯;1976年01期
中国重要会议论文全文数据库
王时越;潘琪;缪云伟;迟珊;;[A];第五届全国MTS材料试验学术会议论文集[C];2001年
高宏科;王淑超;;[A];全国第二届中医中西医结合肾脏病临床进展学术研讨会论文集[C];2007年
陶红艳;张运陶;;[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
崔岱远;贾彦龙;成世和;;[A];全国中成药学术研讨会论文汇编[C];1994年
李付胜;秦洪;侯红斌;廖知力;;[A];中国采选技术十年回顾与展望[C];2012年
中国硕士学位论文全文数据库
余维新;[D];南京理工大学;2011年
郭康;[D];燕山大学;2014年
王对对;[D];燕山大学;2014年
赵鹏飞;[D];南昌大学;2014年
徐高庆;[D];上海交通大学;2010年
&快捷付款方式
&订购知网充值卡
400-819-9993
《中国学术期刊(光盘版)》电子杂志社有限公司
同方知网数字出版技术股份有限公司
地址:北京清华大学 84-48信箱 大众知识服务
出版物经营许可证 新出发京批字第直0595号
订购热线:400-819-82499
服务热线:010--
在线咨询:
传真:010-
京公网安备75号细胞库/细胞培养
ELISA试剂盒
实验室仪器/设备
原辅料包材
体外检测试剂
统计第十课:SPSS 重复测量的多因素方差分析
统计第十课:SPSS 重复测量的多因素方差分析
点击次数:5181
前面几期,我们讲了基本的方差分析,但是在一些研究中,我们要对样本进行多次重复实验,那么,今天就来讲讲重复测量方差分析。 一、概述 重复测量数据的方差分析是对同一因变量进行重复测量的一种试验设计技术。在给予一种或多种处理后,分别在不同的时间点上通过重复测量同一个受试对象获得的指标的观察值,或者是通过重复测量同一个个体的不同部位(或组织)获得的指标的观察值。重复测量数据在科学研究中十分常见。 分析前要对重复测量数据之间是否存在相关性进行球形检验。如果该检验结果为 P﹥0.05,则说明重复测量数据之间不存在相关性,测量数据符合 Huynh-Feldt 条件,可以用单因素方差分析的方法来处理;如果检验结果 P﹤0.05,则说明重复测量数据之间是存在相关性的,所以不能用单因素方差分析的方法处理数据。在科研实际中的重复测量设计资料后者较多,应该使用重复测量设计的方差分析模型。 球形条件不满足时常有两种方法可供选择: (1)采用 MANOVA(多变量方差分析方法); (2)对重复测量 ANOVA 检验结果中与时间有关的 F 值的自由度进行调整。 二、实例解析 新生儿胎粪吸入综合征(MAS)是由于胎儿在子宫内或着生产时吸入了混有胎粪的羊水,从而导致呼吸道和肺泡发生机械性阻塞,并伴有肺泡表面活性物质失活,而且肺组织也会发生化学性炎症,胎儿出生后出现的以呼吸窘迫为主,同时伴有其他脏器受损现象的一组综合征 。血管内皮生长因子 (vascular endothelial growth factor,VEGF) 是一种有丝分裂原,它特异作用于血管内皮细胞时,能够调节血管内皮细胞的增殖和迁移,从而使血管通透性增加。而本实验旨在通过观察分析给予外源性肺表面活性物质治疗前后胎粪吸入综合征患儿血清中 VEGF 的含量变化,评价药物治疗的效果。 将收治的诊断胎粪吸入综合症的新生儿共 42 名。将患儿随机分为肺表面活性物质治疗组(PS 组)和常规治疗组(对照组),每组各 21 例。PS 组和对照组两组所有患儿均给予除用药外的其他相应的对症治疗。PS 组患儿给予牛肺表面活性剂 PS 70 mg/kg 治疗。采集 PS 组及对照组患儿 0 小时,治疗后 24 小时和 72 小时静脉血 2 ml,离心并提取上清液后保存备用并记录血清中 VEGF 的含量变化情况。 结果如下:
3、统计分析 建立数据文件 变量视图:
数据视图:
菜单选择:
首先进入如下对话框,在「被试内因子名称」中输入「time」,「级别数」输入 3,因为每个患者重复测量了 3 次。
后点击「添加」按钮。此时下方「定义」按钮变为可用,点击进入下列对话框:
将「group」选入「因子列表」框,t1-t3 分别选入「全体内变量(time)」框内,如下图所示:
点击右上角「模型」按钮,进入以下对话框,选择「设定」,将「time」选入「全体内模型」框,「group」选入「群体间模型」框,「构建项」选择「主效应」。下方的平方和选「类型 III」,这是对于平衡数据。如果两组样本量不等,则选择「类型 IV」。
点击「继续」返回,点击「绘制」按钮。进入下面对话框:将「time」选入「水平轴」,group 选入「单图」,然后点击「添加」按钮,下面框中会显示「time*group」。
点击「继续」返回,点击「两两比较」按钮,将 group 选入右侧「两两比较检验」框中,选中复选框「LSD」。
点击「继续」返回,点击「选项」按钮,进入下面对话框:将 time 选入「显示均值框」,选中「比较主效应」复选框,选中下方「描述统计」复选框。
下方显著性水平设为 0.05。点击「继续」返回,点击「确定」输出结果。 4、结果解读:
这是一个关于各个时间点的两组数据描述性统计。
这是球形检验结果,p = 0.001&0.05,所以不满足球形分布假设,需要进行多变量方差分析或者自由度调整,SPSS 接下来会给出以上两种结果。
这是进行多变量方差分析的结果,给出了 4 种统计量,它们的检验结果一致,time 的 P&0.001,说明各个时间点的数据的差异有统计学意义,time*group 的 P&0.05,说明时间和分组无交互作用,说明时间因素(即 0 小时、24 小时、72 小时)的作用不随分组(即治疗组和对照组)的不同而不同。
所谓「主体内」,即是重复测量的各个时间点。上表是用各个时间点进行分组的方差分析表,给出 4 种统计量,第一种为满足球星假设的情况,后三种对自由度进行了校正,本题目中不满足球形分布假设,只能看下面的三种检验方法。结果解释同上一个表。
这是对分组的方差分析,对变量进行如下的变换:y =(t1+t2+t3)/sqrt(3)。P = 0.043&0.05,说明有治疗组与对照组之间有统计学差异。
这个图可以直观地看出测量指标随时间的变化趋势。治疗组与对照组两组资料随时间变化的趋势大致相同,治疗组血清中 VEGF 的含量较对照组呈下降趋势,说明治疗组的效果优于对照组。 我们还可以给出在每个时间点上两个分组之间的比较,需要用到多变量方差分析:操作步骤如下:跟之前操作类似,不赘述,看图就行。
每个时间点上两组之间的比较(即分别比较 0 小时、24 小时及 72 小时时对照组和治疗组的数据)结果显示 0 小时时 P﹥0.05,治疗组和对照组之间没有统计学差异,而 24 小时和 72 小时时 P﹤0.05,治疗组和对照组两组间有显著的统计学差异。
wudihero007
相关实验方法
本网站所有注明“来源:丁香园”的文字、图片和音视频资料,版权均属于丁香园所有,非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:丁香园”。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
难度系数:
共412人点评打分
难度系数:
共185人点评打分
难度系数:
共154人点评打分
难度系数:
共147人点评打分
难度系数:
共125人点评打分
丁香通采购热线:400-
Copyright (C)
DXY All Rights Reserved.您的位置: &
统计因素分析法刍议
优质期刊推荐503 Service Temporarily Unavailable
503 Service Temporarily Unavailable
openresty/1.9.7.4苹果/安卓/wp
积分 17247, 距离下一级还需 1053 积分
权限: 自定义头衔, 签名中使用图片, 设置帖子权限, 隐身, 设置回复可见, 签名中使用代码
道具: 彩虹炫, 涂鸦板, 雷达卡, 热点灯, 金钱卡, 显身卡, 匿名卡, 抢沙发, 提升卡, 沉默卡, 千斤顶, 变色卡下一级可获得
道具: 置顶卡
购买后可立即获得
权限: 隐身
道具: 金钱卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
TA的文库&&
苦逼签到天数: 8 天连续签到: 1 天[LV.3]偶尔看看II
一、因子分析与其他分析的概念与区别
1.(Factor Analysis)
  因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量),以较少的几个因子反映原资料的大部分信息。运用这种研究技术,我们可以方便地找出影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。
  主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。
  1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。
  2、主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。
  3、主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。
  4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。
  5、在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。当然,这中情况也可以使用因子得分做到。所以这中区分不是绝对的。
  总得来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。
  在算法上,主成分分析和因子分析很类似,不过,在因子分析中所采用的协方差矩阵的对角元素不在是变量的方差,而是和变量对应的共同度(变量方差中被各因子所解释的部分)。
  3.聚类分析(Cluster Analysis)
  聚类分析是直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类的分析技术 。
  在市场研究领域,聚类分析主要应用方面是帮助我们寻找目标消费群体,运用这项研究技术,我们可以划分出产品的细分市场,并且可以描述出各细分市场的人群特征,以便于客户可以有针对性的对目标消费群体施加影响,合理地开展工作。
  4.判别分析(Discriminatory Analysis)
  判别分析(Discriminatory Analysis)的任务是根据已掌握的1批分类明确的样品,建立较好的判别函数,使产生错判的事例最少,进而对给定的1个新样品,判断它来自哪个总体。根据资料的性质,分为定性资料的判别分析和定量资料的判别分析;采用不同的判别准则,又有费歇、贝叶斯、距离等判别方法。
  费歇(FISHER)判别思想是投影,使多维问题简化为一维问题来处理。选择一个适当的投影轴,使所有的样品点都投影到这个轴上得到一个投影值。对这个投影轴的方向的要求是:使每一类内的投影值所形成的类内离差尽可能小,而不同类间的投影值所形成的类间离差尽可能大。贝叶斯(BAYES)判别思想是根据先验概率求出后验概率,并依据后验概率分布作出统计推断。所谓先验概率,就是用概率来描述人们事先对所研究的对象的认识的程度;所谓后验概率,就是根据具体资料、先验概率、特定的判别规则所计算出来的概率。它是对先验概率修正后的结果。
  距离判别思想是根据各样品与各母体之间的距离远近作出判别。即根据资料建立关于各母体的距离判别函数式,将各样品数据逐一代入计算,得出各样品与各母体之间的距离值,判样品属于距离值最小的那个母体。
  5.对应分析(Correspondence Analysis)
  对应分析是一种用来研究变量与变量之间联系紧密程度的研究技术。
  运用这种研究技术,我们可以获取有关消费者对产品品牌定位方面的图形,从而帮助您及时调整营销策略,以便使产品品牌在消费者中能树立起正确的形象。
  这种研究技术还可以用于检验广告或市场推广活动的效果,我们可以通过对比广告播出前或市场推广活动前与广告播出后或市场推广活动后消费者对产品的不同认知图来看出广告或市场推广活动是否成功的向消费者传达了需要传达的信息。
  6.典型相关分析
  典型相关分析是分析两组随机变量间线性密切程度的统计方法,是两变量间线性相关分析的拓广。各组随机变量中既可有定量随机变量,也可有定性随机变量(分析时须F6说明为定性变量)。本法还可以用于分析高维列联表各边际变量的线性关系。
  注意:
  1.严格地说,一个典型相关系数描述的只是一对典型变量之间的相关,而不是两个变量组之间的相关。而各对典型变量之间构成的多维典型相关才共同揭示了两个观测变量组之间的相关形式。
  2.典型相关模型的基本假设和数据要求
  要求两组变量之间为线性关系,即每对典型变量之间为线性关系;
  每个典型变量与本组所有观测变量的关系也是线性关系。如果不是线性关系,可先线性化:如经济水平和收入水平与其他一些社会发展水之间并不是线性关系,可先取对数。即log经济水平,log收入水平。
  3.典型相关模型的基本假设和数据要求
  所有观测变量为定量数据。同时也可将定性数据按照一定形式设为虚拟变量后,再放入典型相关模型中进行分析。
  7.多维尺度分析(Multi-dimension Analysis)
  多维尺度分析(Multi-dimension Analysis) 是市场研究的一种有力手段,它可以通过低维空间(通常是二维空间)展示多个研究对象(比如品牌)之间的联系,利用平面距离来反映研究对象之间的相似程度。由于多维尺度分析法通常是基于研究对象之间的相似性(距离)的,只要获得了两个研究对象之间的距离矩阵,我们就可以通过相应统计软件做出他们的相似性知觉图。
  在实际应用中,距离矩阵的获得主要有两种方法:一种是采用直接的相似性评价,先所有评价对象进行两两组合,然后要求被访者所有的这些组合间进行直接相似性评价,这种方法我们称之为直接评价法;另一种为间接评价法,由研究人员根据事先经验,找出影响人们评价研究对象相似性的主要属性,然后对每个研究对象,让被访者对这些属性进行逐一评价,最后将所有属性作为多维空间的坐标,通过距离变换计算对象之间的距离。
  多维尺度分析的主要思路是利用对被访者对研究对象的分组,来反映被访者对研究对象相似性的感知,这种方法具有一定直观合理性。同时该方法实施方便,调查中被访者负担较小,很容易得到理解接受。当然,该方法的不足之处是牺牲了个体距离矩阵,由于每个被访者个体的距离矩阵只包含1与0两种取值,相对较为粗糙,个体距离矩阵的分析显得比较勉强。但这一点是完全可以接受的,因为对大多数研究而言,我们并不需要知道每一个体的空间知觉图。
  多元统计分析是统计学中内容十分丰富、应用范围极为广泛的一个分支。在自然科学和社会科学的许多学科中,研究者都有可能需要分析处理有多个变量的数据的问题。能否从表面上看起来杂乱无章的数据中发现和提炼出规律性的结论,不仅对所研究的专业领域要有很好的训练,而且要掌握必要的统计分析工具。对实际领域中的研究者和高等院校的研究生来说,要学习掌握多元统计分析的各种模型和方法,手头有一本好的、有长久价值的参考书是非常必要的。这样一本书应该满足以下条件:首先,它应该是“浅入深出”的,也就是说,既可供初学者入门,又能使有较深基础的人受益。其次,它应该是既侧重于应用,又兼顾必要的推理论证,使学习者既能学到“如何”做,而且在一定程度上了解“为什么”这样做。最后,它应该是内涵丰富、全面的,不仅要基本包括各种在实际中常用的多元统计分析方法,而且还要对现代统计学的最新思想和进展有所介绍、交代。
二、因子分析与因子分析法
  主成分分析通过线性组合将原变量综合成几个主成分,用较少的综合指标来代替原来较多的指标(变量)。在多变量分析中,某些变量间往往存在相关性。是什么原因使变量间有关联呢?是否存在不能直接观测到的、但影响可观测变量变化的公共因子?因子分析法(Factor Analysis)就是寻找这些公共因子的模型分析方法,它是在主成分的基础上构筑若干意义较为明确的公因子,以它们为框架分解原变量,以此考察原变量间的联系与区别。
  例如,随着年龄的增长,儿童的身高、体重会随着变化,具有一定的相关性,身高和体重之间为何会有相关性呢?因为存在着一个同时支配或影响着身高与体重的生长因子。那么,我们能否通过对多个变量的相关系数矩阵的研究,找出同时影响或支配所有变量的共性因子呢?因子分析就是从大量的数据中“由表及里”、“去粗取精”,寻找影响或支配变量的多变量统计方法。
  可以说,因子分析是主成分分析的推广,也是一种把多个变量化为少数几个综合变量的多变量分析方法,其目的是用有限个不可观测的隐变量来解释原始变量之间的相关关系。
  因子分析主要用于:1、减少分析变量个数;2、通过对变量间相关关系探测,将原始变量进行分类。即将相关性高的变量分为一组,用共性因子代替该组变量。
  1. 因子分析模型
  因子分析法是从研究变量内部相关的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。它的基本思想是将观测变量进行分类,将相关性较高,即联系比较紧密的分在同一类中,而不同类变量之间的相关性则较低,那么每一类变量实际上就代表了一个基本结构,即公共因子。对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。
  因子分析模型描述如下:
  (1)X = (x1,x2,…,xp)¢是可观测随机向量,均值向量E(X)=0,协方差阵Cov(X)=∑,且协方差阵∑与相关矩阵R相等(只要将变量标准化即可实现)。
  (2)F = (F1,F2,…,Fm)¢(m&p)是不可测的向量,其均值向量E(F)=0,协方差矩阵Cov(F) =I,即向量的各分量是相互独立的。
  (3)e = (e1,e2,…,ep)¢与F相互独立,且E(e)=0, e的协方差阵∑是对角阵,即各分量e之间是相互独立的,则模型:
  x1 = a11F1+ a12F2 +…+a1mFm + e1
  x2 = a21F1+a22F2 +…+a2mFm + e2
  ………
  xp = ap1F1+ ap2F2 +…+apmFm + ep
  称为因子分析模型,由于该模型是针对变量进行的,各因子又是正交的,所以也称为R型正交因子模型。
  其矩阵形式为: x =AF + e .
  其中:
  x=,A=,F=,e=
  这里,
  (1)m £ p;
  (2)Cov(F,e)=0,即F和e是不相关的;
  (3)D(F) = Im ,即F1,F2,…,Fm不相关且方差均为1;
  D(e)=,即e1,e2,…,ep不相关,且方差不同。
  我们把F称为X的公共因子或潜因子,矩阵A称为因子载荷矩阵,e 称为X的特殊因子。
  A = (aij),aij为因子载荷。数学上可以证明,因子载荷aij就是第i变量与第j因子的相关系数,反映了第i变量在第j因子上的重要性。
  2. 模型的统计意义
  模型中F1,F2,…,Fm叫做主因子或公共因子,它们是在各个原观测变量的表达式中都共同出现的因子,是相互独立的不可观测的理论变量。公共因子的含义,必须结合具体问题的实际意义而定。e1,e2,…,ep叫做特殊因子,是向量x的分量xi(i=1,2,…,p)所特有的因子,各特殊因子之间以及特殊因子与所有公共因子之间都是相互独立的。模型中载荷矩阵A中的元素(aij)是为因子载荷。因子载荷aij是xi与Fj的协方差,也是xi与Fj的相关系数,它表示xi依赖Fj的程度。可将aij看作第i个变量在第j公共因子上的权,aij的绝对值越大(|aij|£1),表明xi与Fj的相依程度越大,或称公共因子Fj对于xi的载荷量越大。为了得到因子分析结果的经济解释,因子载荷矩阵A中有两个统计量十分重要,即变量共同度和公共因子的方差贡献。
  因子载荷矩阵A中第i行元素之平方和记为hi2,称为变量xi的共同度。它是全部公共因子对xi的方差所做出的贡献,反映了全部公共因子对变量xi的影响。hi2大表明x的第i个分量xi对于F的每一分量F1,F2,…,Fm的共同依赖程度大。
  将因子载荷矩阵A的第j列( j =1,2,…,m)的各元素的平方和记为gj2,称为公共因子Fj对x的方差贡献。gj2就表示第j个公共因子Fj对于x的每一分量xi(i= 1,2,…,p)所提供方差的总和,它是衡量公共因子相对重要性的指标。gj2越大,表明公共因子Fj对x的贡献越大,或者说对x的影响和作用就越大。如果将因子载荷矩阵A的所有gj2 ( j =1,2,…,m)都计算出来,使其按照大小排序,就可以依此提炼出最有影响力的公共因子。
  3. 因子旋转
  建立因子分析模型的目的不仅是找出主因子,更重要的是知道每个主因子的意义,以便对实际问题进行分析。如果求出主因子解后,各个主因子的典型代表变量不很突出,还需要进行因子旋转,通过适当的旋转得到比较满意的主因子。
  旋转的方法有很多,正交旋转(orthogonal rotation)和斜交旋转(oblique rotation)是因子旋转的两类方法。最常用的方法是最大方差正交旋转法(Varimax)。进行因子旋转,就是要使因子载荷矩阵中因子载荷的平方值向0和1两个方向分化,使大的载荷更大,小的载荷更小。因子旋转过程中,如果因子对应轴相互正交,则称为正交旋转;如果因子对应轴相互间不是正交的,则称为斜交旋转。常用的斜交旋转方法有Promax法等。
  4.因子得分
  因子分析模型建立后,还有一个重要的作用是应用因子分析模型去评价每个样品在整个模型中的地位,即进行综合评价。例如地区经济发展的因子分析模型建立后,我们希望知道每个地区经济发展的情况,把区域经济划分归类,哪些地区发展较快,哪些中等发达,哪些较慢等。这时需要将公共因子用变量的线性组合来表示,也即由地区经济的各项指标值来估计它的因子得分。
  设公共因子F由变量x表示的线性组合为:
  Fj = uj1 xj1+ uj2 xj2+…+ujpxjp j=1,2,…,m
  该式称为因子得分函数,由它来计算每个样品的公共因子得分。若取m=2,则将每个样品的p个变量代入上式即可算出每个样品的因子得分F1和F2,并将其在平面上做因子得分散点图,进而对样品进行分类或对原始数据进行更深入的研究。
  但因子得分函数中方程的个数m小于变量的个数p,所以并不能精确计算出因子得分,只能对因子得分进行估计。估计因子得分的方法较多,常用的有回归估计法,Bartlett估计法,Thomson估计法。
  (1)回归估计法
  F = X b = X (X ¢X)-1A¢ = XR-1A¢ (这里R为相关阵,且R = X ¢X )。
  (2)Bartlett估计法
  Bartlett估计因子得分可由最小二乘法或极大似然法导出。
  F = [(W-1/2A)¢ W-1/2A]-1(W-1/2A)¢ W-1/2X = (A¢W-1A)-1A¢W-1X
  (3)Thomson估计法
  在回归估计法中,实际上是忽略特殊因子的作用,取R = X ¢X,若考虑特殊因子的作用,此时R = X ¢X+W,于是有:
  F = XR-1A¢ = X (X ¢X+W)-1A¢
  这就是Thomson估计的因子得分,使用矩阵求逆算法(参考线性代数文献)可以将其转换为:
  F = XR-1A¢ = X (I+A¢W-1A)-1W-1A¢
  5. 因子分析的步骤
  因子分析的核心问题有两个:一是如何构造因子变量;二是如何对因子变量进行命名解释。因此,因子分析的基本步骤和解决思路就是围绕这两个核心问题展开的。
  (i)因子分析常常有以下四个基本步骤:
  (1)确认待分析的原变量是否适合作因子分析。
  (2)构造因子变量。
  (3)利用旋转方法使因子变量更具有可解释性。
  (4)计算因子变量得分。
  (ii)因子分析的计算过程:
  (1)将原始数据标准化,以消除变量间在数量级和量纲上的不同。
  (2)求标准化数据的相关矩阵;
  (3)求相关矩阵的特征值和特征向量;
  (4)计算方差贡献率与累积方差贡献率;
  (5)确定因子:
  设F1,F2,…, Fp为p个因子,其中前m个因子包含的数据信息总量(即其累积贡献率)不低于80%时,可取前m个因子来反映原评价指标;
  (6)因子旋转:
  若所得的m个因子无法确定或其实际意义不是很明显,这时需将因子进行旋转以获得较为明显的实际含义。
  (7)用原指标的线性组合来求各因子得分:
  采用回归估计法,Bartlett估计法或Thomson估计法计算因子得分。
  (8)综合得分
  以各因子的方差贡献率为权,由各因子的线性组合得到综合评价指标函数。
  F = (w1F1+w2F2+…+wmFm)/(w1+w2+…+wm )
  此处wi为旋转前或旋转后因子的方差贡献率。
  (9)得分排序:利用综合得分可以得到得分名次。
  在采用多元统计分析技术进行数据处理、建立宏观或微观系统模型时,需要研究以下几个方面的问题:
简化系统结构,探讨系统内核。可采用主成分分析、因子分析、对应分析等方法,在众多因素中找出各个变量最佳的子集合,从子集合所包含的信息描述多变量的系统结果及各个因子对系统的影响。“从树木看森林”,抓住主要矛盾,把握主要矛盾的主要方面,舍弃次要因素,以简化系统的结构,认识系统的内核。构造预测模型,进行预报控制。在自然和社会科学领域的科研与生产中,探索多变量系统运动的客观规律及其与外部环境的关系,进行预测预报,以实现对系统的最优控制,是应用多元统计分析技术的主要目的。在多元分析中,用于预报控制的模型有两大类。一类是预测预报模型,通常采用多元线性回归或逐步回归分析、判别分析、双重筛选逐步回归分析等建模技术。另一类是描述性模型,通常采用聚类分析的建模技术。进行数值分类,构造分类模式。在多变量系统的分析中,往往需要将系统性质相似的事物或现象归为一类。以便找出它们之间的联系和内在规律性。过去许多研究多是按单因素进行定性处理,以致处理结果反映不出系统的总的特征。进行数值分类,构造分类模式一般采用聚类分析和判别分析技术。
  如何选择适当的方法来解决实际问题,需要对问题进行综合考虑。对一个问题可以综合运用多种统计方法进行分析。例如一个预报模型的建立,可先根据有关生物学、生态学原理,确定理论模型和试验设计;根据试验结果,收集试验资料;对资料进行初步提炼;然后应用统计分析方法(如相关分析、逐步回归分析、主成分分析等)研究各个变量之间的相关性,选择最佳的变量子集合;在此基础上构造预报模型,最后对模型进行诊断和优化处理,并应用于生产实际。
载入中......
虽然有些错字,但还是很有帮助,谢谢!
学习了,如果有个例子支持一下对于初学者更有启发,谢谢楼主的分享
谢谢楼主刊发的系列文章。
mark 谢谢总结
学习了,谢谢楼主
收藏了,谢谢瑰宝
无限扩大经管职场人脉圈!每天抽选10位免费名额,现在就扫& 论坛VIP& 贵宾会员& 可免费加入
加入我们,立即就学扫码下载「就学」app& Join us!& JoinLearn&
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向,请联系(010-);
邮箱:service@pinggu.org
投诉或不良信息处理:(010-)
京ICP证090565号
京公网安备号
论坛法律顾问:王进律师

我要回帖

更多关于 因素分析法例题 的文章

 

随机推荐