怎么看数据怎么看适不适合留刘海做因子分析聚

查看: 4297|回复: 6
用因子分析结果进行聚类分析
认证徽章论坛徽章:66
摘要: 得到因子得分并不是最终的结果,降维是为了使我们的思路更加集中,但降维结束后得到的却未必是我们所期望的。为了更好的加以分析,我们可以在降维因子分析的基础上对得到的潜在因子进行聚类或者计算出综合因子得分进 ...
认证徽章论坛徽章:66
得到因子得分并不是最终的结果,降维是为了使我们的思路更加集中,但降维结束后得到的却未必是我们所期望的。为了更好的加以分析,我们可以在降维因子分析的基础上对得到的潜在因子进行聚类或者计算出综合因子得分进行排序。综合因子得分的计算前面我已经讨论过了(点击这里),卢文岱先生的书里介绍了因子分析之后进行聚类分析,放在这里学习学习。
【案例】:美国洛杉矶12个地区的调查数据(人口、校龄、总雇员、房价、服务),该数据可到人大经济论坛spss版块下载。点击下载
【案例说明】:12个地区的5个调查指标数据经过因子分析处理后,找到两个潜在的因子:人口因子和福利因子。并且spss自动保存了12个地区的因子得分。这个案例的目的在于评价12个地区经济情况。我们现在走一条曲线救国的思路:利用人口因子和福利因子两个变量进行聚类,看看这12个地区有哪些是相似的(同一类),这些相似的地区有哪些特征,从而集中评价属于同一类的某几个或一个地区。
【因子分析过程】:我前面有写,不再讨论。
【聚类过程】:亮点——因子得分散点图-增强聚类的可视化,更加易懂。
认证徽章论坛徽章:66
一、操作:
(1)因子1,因子2为参与聚类的变量,地区编号为标示。
(2)盲聚类,先给定范围2-4类,然后对2、3、4进行比较,最终确定聚为几类。
(3)个人较喜欢输出树状图,讨厌冰柱图。要求输出聚类的树状图。采用欧氏距离平方聚类。
(4)不需要进行标准化处理,因为两个因子本身就是无量纲变量。
二、重要结果(对比):
(1)从聚类分析输出结果很难看出各地区在经济特性方面的区别。
认证徽章论坛徽章:66
认证徽章论坛徽章:66
(2)亮点:因子得分-类别散点图,可视化的效果。
认证徽章论坛徽章:66
上图显示,2、3、7为第二类,处在人口因子和福利因子都较低的左角,可以认为从5个经济指标来看均较差的地区;1、4、5为第一类,人口因子(人口数和就业人数)得分较低,福利因子较高,即人口和就业者较少,但福利条件去很不错的地区群(这可是梦寐以求的好地方啊!);6、8、9、11、12为第三类人口因子较高,福利因子较低,人口多,就业者多,比如hn,人口第一大省,但整体经济实力较东部地区差,福利跟不上。
做法:因子得分2为纵轴、因子得分1为横轴(谁横谁纵没有定论),用地区编号标识地区,用聚类得到的各地区类别号分组。(依次做分为2类的、3类的、4类的散点图进行比较)。
认证徽章论坛徽章:66
三、讨论:
就此案例而言,最终聚为几类合适?卢文岱先生的书并没有给出结果。我个人的思路:从上面的散点图可以看出,编号为10的这个地区,偏离1、5、4地区较远,聚类过程显示这四个地区为同一类。鉴于1、5、4更集中,10地区较远,用异常值的思想来讲,10地区为异常值,单独放一边讨论,视为特例对待。其他11个地区分为3类。即最终聚为4类(或3类+1特例)。
从这个案例可以看出,我们很有必要在spss既得结果中提取其他可视化图形,比如上面这个因子得分散点图,使分析效果更加显著。
itpub.net All Right Reserved. 北京皓辰网域网络信息技术有限公司版权所有    
 北京市公安局海淀分局网监中心备案编号: 广播电视节目制作经营许可证:编号(京)字第1149号查看: 8433|回复: 6
在线时间87 小时最后登录注册时间听众数收听数能力0 分体力1027 点威望0 点阅读权限40积分433相册日志记录帖子主题精华0分享好友
, 积分 433, 距离下一级还需 167 积分
升级&&44.33%当前用户组为 高中生当前积分为 433, 升到下一级还需要 167 点。TA的每日心情开心 16:50签到天数: 107 天[LV.6]常住居民II自我介绍正在准备国家赛
群组:&群组:&
填写您的邮件地址
通过对于建模思路和方法的讲解,突破建模关键十次课的集训,提升获奖率真正的面授培训,数学中国讲师团封闭密训在学习中获得突破和提高帮助学生在美赛中取得理想成绩。KMO值小于0.5,不适合因子分析应该换什么分析法?
踩过的脚印
啦啦啦~~~我是默认签名(*^__^*)
在线时间5024 小时最后登录注册时间听众数收听数能力21 分体力63745 点威望96 点阅读权限250积分22988相册日志记录帖子主题精华15分享好友
数学中国总编辑
TA的每日心情衰 10:46签到天数: 206 天[LV.7]常住居民III
占冰强,数学中国总策划
中国高校数学传媒开放平台负责人
用户厚积薄发已经进行了数学中国团队认证
群组:&群组:&群组:&群组:&群组:&
|邮箱已经成功绑定
当所有变量间的简单相关系数平方和远远大于偏相关系数平方和时,KMO值接近1.KMO值越接近于1,意味着变量间的相关性越强,原有变量越适合作因子分析;当所有变量间的简单相关系数平方和接近0时,KMO值接近0.KMO值越接近于0,意味着变量间的相关性越弱,原有变量越不适合作因子分析。8 o% X8 |' ]- Q1 ~
, u, |% W5 u! Y9 k&&y- D
这个时候试试从其他角度思考下,比如对数据做些预处理,然后重新计算下;另外一种思路就是,可以试试主成分分析,层次分析法等等均可以
在线时间5024 小时最后登录注册时间听众数收听数能力21 分体力63745 点威望96 点阅读权限250积分22988相册日志记录帖子主题精华15分享好友
数学中国总编辑
TA的每日心情衰 10:46签到天数: 206 天[LV.7]常住居民III
占冰强,数学中国总策划
中国高校数学传媒开放平台负责人
用户厚积薄发已经进行了数学中国团队认证
群组:&群组:&群组:&群组:&群组:&
|邮箱已经成功绑定
当所有变量间的简单相关系数平方和远远大于偏相关系数平方和时,KMO值接近1.KMO值越接近于1,意味着变量间的相关性越强,原有变量越适合作因子分析;当所有变量间的简单相关系数平方和接近0时,KMO值接近0.KMO值越接近于0,意味着变量间的相关性越弱,原有变量越不适合作因子分析。$ b& \, f8 s( |$ h# V9 `0 y" c
这个时候试试从其他角度思考下,比如对数据做些预处理,然后重新计算下;另外一种思路就是,可以试试主成分分析,层次分析法等等均可以
&因子分析和主成分分析差不多,对SPSS的操作步骤都差不多,请问有什么区别吗?谢谢解答&
在线时间654 小时最后登录注册时间听众数收听数能力20 分体力6581 点威望7 点阅读权限250积分3155相册日志记录帖子主题精华2分享好友
TA的每日心情慵懒 19:37签到天数: 409 天[LV.9]以坛为家II
毕业学校您还未进行姓名认证
狂热的数模爱好者
用户magic2728已经进行了数学中国团队认证
群组:&群组:&群组:&群组:&群组:&
也许是这组数据本来就不适应降维操作,所以多多尝试楼上提到的其他方法吧。
&好的,谢谢&
啦啦啦~~~我是默认签名(*^__^*)
在线时间87 小时最后登录注册时间听众数收听数能力0 分体力1027 点威望0 点阅读权限40积分433相册日志记录帖子主题精华0分享好友
, 积分 433, 距离下一级还需 167 积分
升级&&44.33%当前用户组为 高中生当前积分为 433, 升到下一级还需要 167 点。TA的每日心情开心 16:50签到天数: 107 天[LV.6]常住居民II自我介绍正在准备国家赛
群组:&群组:&
通过对于建模思路和方法的讲解,突破建模关键十次课的集训,提升获奖率真正的面授培训,数学中国讲师团封闭密训在学习中获得突破和提高帮助学生在美赛中取得理想成绩。magic2728 发表于
14:39 + }2 c+ g- ^$ @* v
也许是这组数据本来就不适应降维操作,所以多多尝试楼上提到的其他方法吧。
好的,谢谢
啦啦啦~~~我是默认签名(*^__^*)
在线时间87 小时最后登录注册时间听众数收听数能力0 分体力1027 点威望0 点阅读权限40积分433相册日志记录帖子主题精华0分享好友
, 积分 433, 距离下一级还需 167 积分
升级&&44.33%当前用户组为 高中生当前积分为 433, 升到下一级还需要 167 点。TA的每日心情开心 16:50签到天数: 107 天[LV.6]常住居民II自我介绍正在准备国家赛
群组:&群组:&
厚积薄发 发表于
16:08 4 U: r- H9 ~; a/ Z! l
当所有变量间的简单相关系数平方和远远大于偏相关系数平方和时,KMO值接近1.KMO值越接近于1,意味着变量间的 ...
因子分析和主成分分析差不多,对SPSS的操作步骤都差不多,请问有什么区别吗?谢谢解答
啦啦啦~~~我是默认签名(*^__^*)
在线时间17 小时最后登录注册时间听众数收听数能力0 分体力158 点威望0 点阅读权限20积分68相册日志记录帖子主题精华0分享好友
, 积分 68, 距离下一级还需 32 积分
升级&&66.32%当前用户组为 小学生当前积分为 68, 升到下一级还需要 32 点。TA的每日心情衰 03:31签到天数: 32 天[LV.5]常住居民I自我介绍新手
好像因子分析和主成分分析做出来的结果差不多、、我上个月曾经做过一个、也是KMO<0.7的、、
啦啦啦~~~我是默认签名(*^__^*)
社区QQ达人
使用QQ帐号登录论坛的用户
邮箱绑定达人
论坛绑定邮箱的用户
数学中国元老级人物!
对发帖积极贡献的会员
新人进步奖
凡是完成新手任务的会员皆可申请
原创写作奖
经常在社区发表优秀原创作品,特颁发此奖!
最具活力勋章
你在哈哈东奔西跑,哪里有你,哪里就有你的身影!
风雨历程奖
真诚感谢伴随Madio经历过若干次的风风雨雨,却始终支持着论坛的朋友!
听说数学模型只有三种,学会了就啥都不愁了?
江湖流传的“函数建模法”可以解决所有建模问题?
照着“三步学习法”学数学模型就可以参透问题的本质?
看到题目没有思路,居然有“审题三部曲”这等神器?
论文读不完,居然有“论文阅读法则”帮我们领会论文真谛?
。。。。。。.没错,这就是 magic 老师课程里秘密教授的数模绝学,5 年精品,绝对原创,仅此一家!
Powered by
& &论坛法律顾问:王兆丰

我要回帖

更多关于 适合做因子分析的数据 的文章

 

随机推荐