spss怎么做主要spss分类变量相关分析析

相关分析是很基础的一种分析方法,接触spss的同学很快就会学习到想相关分析。虽然他很基础,但是在做很多高级分析之前,都要进行相关分析。这篇问文章就系统的和大家分享一下spss里如何做相关分析。
在spss中相关分析主要分为三大类,分别是双变量相关分析,偏相关分析和距离相关分析。
1、双变量相关分析主要研究两个变量数量之间的相关性。它又
相关分析是很基础的一种分析方法,接触spss的同学很快就会学习到想相关分析。虽然他很基础,但是在做很多高级分析之前,都要进行相关分析。这篇问文章就系统的和大家分享一下spss里如何做相关分析。
在spss中相关分析主要分为三大类,分别是双变量相关分析,偏相关分析和距离相关分析。
1、双变量相关分析主要研究两个变量数量之间的相关性。它又分为pearson相关分析,kendall相关分析,kendall等级相关分析,还有spearmen等级相关分析这四种。
Pearson相关分析是应用最最多的一种分析方法,它适用于评价两个连续变量十是否相关,常见的例子有分析体重和身高的相关性啊,分析睡眠时间和学习时间的相关性啊等等。这两个例子里变量都是连续性的,所以用pearson相关分析。主要分析过程如下,选择菜单分析——相关——双变量,打开双变量主对话框,把要分析的变量选入变量框(两个以上哈),确定就可以了。很简单。结果也很容易看,主要看两个指标,一个是p值,就是sig(不要笑,虽然很简单的一个点,可是就是有好多人都搞不清楚),p值小于0.5,就认为两个变量显著相关,p值小于0.01,就认为极其显著。另一个是相关系数,相关系数为正就是正相关,为负就是负相关,相关系数的绝对值越接近一就说明相关性越强。一般认为0.7以上是强相关。注意,这里有一个事情很多人都搞不清楚,要特别说一下哈,p值很小,同时相关系数也很小这种情况是存在的。这说明两个变量显著相关,但是是弱相关,也就是说p值和相关系数没什么关系,两个的取值互相不影响,如果出现p值和相关系数都很小的情况,不要太紧张,很正常哈。
Kendall相关分析主要用来反映两个有序分类变量的一致性,有序分类变量就是等级变量,1.2.3.这类递进的,时间序列也是有序分类变量,无序分类则是性别啊,是否成年啊,这种的。总之kendall相关分析的使用范围是用来分析两个有序分类变量,举个例子,如果把睡眠时间和学习时间都用等级表示出来(比如一小时一个等级),那这个分析就可以用kendall,它的结果观察方法和pearson一样,就不在重复了。
Kendall等级相关分析所适用的情况是另一种,它操作方法和上一个kendall的例子一样,但是用于等级资料,是要加权的。举个例子,比如我想分析一下一个人每天吃不吃水果和这个人的营养状况的相关性,那就要用到等级分析。这个例子和上边的例子的区别很明显,上边都是数值型的变量,而这个例子中是要自己定义的,比如我定义吃水果是1,不吃是2,定义营养状况为差,中,强,分别对应1,2,3。然后我想分析的话我就定义变量水果食用情况,营养状况,计数,用计数进行加权后做kendall分析,当然可以直接输入一大堆数据,如果不嫌麻烦的话。结果分析方法同上。
Spearman等级相关分析和kendall有一点点类似,适用于分析含有等级资料的变量,举个例子,分析努力程度和学习成绩之间的关系,其中努力程度是要分等级的资料,学习成绩则是数值型的,这时候就要用spearman,结果分析同上。
2、偏相关分析和双变量相关分析的不同之处在于偏相关分析要考虑除却分析的变量以外是否有其他变量影响到这两个变量。比如,举个例子,比如我现在有一个运动员的身高,肺活量,和短跑成绩。我想要分析身高和短跑成绩的相关性的话,我就要使用偏相关分析,因为肺活量也影响到了身高和短跑成绩,我得剔除这个变量的影响,所以呢,我就不用双变量,而是使用偏相关。我打开菜单分析——相关——偏相关,打开主面板,把身高和短跑成绩选到变量里,把肺活量选到控制里边,然后点确定。输出表的观察方式和上边一样,不在重复。在输出表里,它会显示出没有控制变量的时候的相关系数和有控制变量的时候的相关系数,如果数据恰当的话,你会观察到一个相当有趣的现象,不控制肺活量的时候,身高和短跑成绩是相关的,控制的时候,身高和短跑成绩就不相关了。So,明白偏相关的作用了吗?
需要特别说明一下的是,偏相关分析并不像双变量那样有四种方法可以供你选择,它的适用范围一般是一些数值型的变量,一些你能判断到底有没有关系的变量,你也许应该先用双变量两两测出自变量是否相关,然后再考虑要不要用偏相关,而且假如你的偏相关的变量是等级资料,结果有可能会很尴尬。
3、距离相关分析是一个初学者不那么常用到的分析,不过为了完整性,本文还是列了出来。它用来计算个案或变量之间距离相异性或相似性度量,和其他模块,比如因子分析,聚类分析,多维尺度分析一起使用以助于分析复合数据集。它也分为两种,变量距离相关分析,个案距离相关分析。
我们还是使用一个例子来进行学习。比如我们想要分析学生的身高,肺活量,短跑成绩这三个变量的亲密度,我们选择菜单分析——相关——距离,打开主面板,在变量列表选入这三个变量,下边的计算距离选择变量间,在下边的标准选择相似性,单击度量,打开度量面板。这个面板里边默认为区间,pearson相关性。另外还有一个二分类,我们在这里不讨论二分类到底是干嘛的(有兴趣的同学可以自己去试试),就按默认的,点继续,点确定。然后我们观察输出窗口,他会输出一个近似矩阵,由于我们上边选的是相似性,所以这个矩阵里边的值越接近1,就说明对应的两个变量距离越近,就是说越亲近,相关性越强。如果选的是不相似性,那么得出的数值越小距离越近,最小是0,最大值很可能超过1,超过了也不要紧张。它比双变量做出来的结果要直接,它不考虑p值,所以两个分析还是不一样的哈。个案距离相关分析和这个类似,只是把计算距离选成了个案,假如你只想分析其中几个个案,你需要在数据——选择个案,里边选择一下你的个案。然后做距离相关分析,其他的默认哈。
用云栖社区APP,舒服~
【云栖快讯】12月6日-7日,双11技术大起底!8位阿里技术大神深度解读:前端极限挑战、网络自动化、在线AI推荐应用、超大规模Docker实战、 Buy+VR购物背后的快速交付、数字大屏的研发经验等。&&
国内建站市场NO.1
基于全网公开发布数据、传播路径和受众群体画像,利用语义分析、情感算法和机器学习,分析公众对品牌形象、热点事件和公...
阿里巴巴自主研发的海量数据实时高并发在线分析云计算服务,使得您可以在毫秒级针对千亿级数据进行即时的多维分析透视和...
为您提供简单高效、处理能力可弹性伸缩的计算服务,帮助您快速构建更稳定、安全的应用,提升运维效率,降低 IT 成本...
云栖大会·广东峰会,物联网先锋业务即将刷新智能世界
Loading...spss怎么做相关性分析 ?
spss怎么做相关性分析 ?
  怎么做相关性分析呢?spss中文名统计产品与服务解决方案,是一款专业的数据统计分析软件;具体spss相关性分析怎么做呢?我们一起来学习一下spss相关性分析教程。  spss相关性分析教程:  例:学生每天学习时间T与学习综合成绩G之间的相关性  原始数据:   G=f(T),其中T为自变量,G为因变量  step1:建立数据文件 file——new——  定义变量 选中左下角菜单Variable view,输入变量名T,其他选项不变,令起一行,输入变量  名G其他选项不变,切换到data view(在左下角),将数据复制进去。    Step2:进行数据分析:在spss最上面菜单里面选中Analyze——correlate——bivariate(双变量)    左边包含G,T的框为源变量框,后面的空白框为分析变量框,我们现在需要分析G和T的关系,因此将源变量框中的G和T选进分析变量框待分析。    (1)correlation coefficients(相关系数)包括三个选项:  Pearson:皮尔逊相关,计算连续变量或是等间距测度的变量间的相关分析;  Kendall:肯德尔相关,计算等级变量间的秩相关;  Spearman:斯皮尔曼相关,计算斯皮尔曼秩相关。  注:Pearson可用来分析①分布不明,非等间距测度的连续变量  Kendall可用来分析①分布不明,非等间距测度的连续变量,②完全等级的离散变量,③数据资料不服从双变量正态分布或总体分布型未知。第②种情况只能用Kendall分析  Spearman可用来分析数据资料不服从双变量正态分布或总体分布型未知  (2)Test of significance选项  Two-tailed:双尾检验,如果事先不知道相关方向(正相关还是负相关)则可以选择此项;  One-tailed:单尾检验,如果事先知道相关方向可以选择此项。  (3)Flag significant correlations:表明显著水平,如果选择此项,输出结果中在相关系数值右上方使用*标示显著性水平为5%,用**标示其显著性水平为1%  首先使用pearson,two-tailed(下图),点击右侧options    statistics为统计量,包括均值和标准差 叉积离方差和协方差  missing values 选择默认  点击continue——ok  输出结果(下图)    相关系数为0.975,显著性p=0.000&0.01,有统计学意义  选用Kendall 肯德尔,结果如下:    选用spearman 斯皮尔曼,结果如下:    画散点图:选中Graphs——Scatter/dot-----Simple scatter------define  软件名称:spss 19.0中文版下载软件大小:438MB下载地址:
(责任编辑:小沐)
发表评论:
TA的最新馆藏[转]&[转]&[转]&[转]&[转]&[转]&The page is temporarily unavailable
nginx error!
The page you are looking for is temporarily unavailable.
Please try again later.
Website Administrator
Something has triggered an error on your
This is the default error page for
nginx that is distributed with
It is located
/usr/share/nginx/html/50x.html
You should customize this error page for your own
site or edit the error_page directive in
the nginx configuration file
/etc/nginx/nginx.conf.SPSS——相关分析——Pearson简单相关系数
SPSS——相关分析——Pearson简单相关系数
相关分析属于数据分析流程前端的探索性分析,探究变量间关系及性质,其结果在于指导下一步采取何种方法,是数据挖掘之前的基础工作;
相关分析之前,有必要搞清楚变量的类型,根据具体类型选择合适的相关系数。Pearson相关系数适用于两变量的度量水平都是尺度数据,并且两变量的总体是正态分布或者近似正态分布的情况,还有说法认为其样本量应大于30,可供参考,在这些条件之外的,考虑选择spearman系数或者kendall系数。
相关分析和回归分析的联系和区别
相关分析是回归分析的前提
回归分析是相关分析的拓展
相关图分析
相关系数是对变量之间相关关系密切程度的度量
相关系数的性质
相关系数的划分
Pearson简单相关系数
在统计学中,皮尔逊积矩相关系数(Pearson product-moment correlation coefficient),有时也简称为PMCC,通常用r或是ρ表示,是用来度量两个变量X和Y之间的相互关系(线性相关)的,取值范围在[-1,+1]之间。皮尔逊积矩相关系数在学术研究中被广泛应用来度量两个变量线性相关性的强弱,它是由Karl Pearson在19世纪80年代从Francis Galton介绍的想法基础发展起来的,但是发展后原想法相似但略有不同的,这种相关系数常被称为“Pearson的r”。
Pearson线性相关系数只是许多可能中的一种情况,为了使用Pearson线性相关系数必须假设数据是成对地从正态分布中取得的,并且数据至少在逻辑范畴内必须是等间距的数据。如果这两条件不符合,一种可能就是采用Spearman秩相关系数来代替Pearson线性相关系数。
对于相对中心性的数据(例如,一组已经通过样本均值转换为均值为0的数据),相关系数可以看做是由两随机变量样本绘出的两个向量之间夹角的余弦值。
相关系数的显著性检验的目的是为了检验两个变量之间样本相关系数r(r≠0)与一个相关系数=0的已知总体之间的差别是否是由于抽样误差所产生的,如果差别有统计学意义,则说明两个变量之间存在相关关系。在已经检验两个变量存在相关关系的情况下,相关系数的绝对值越趋近于1,则两个变量相关关系越密切,越趋近于0,则两个变量相关关系越不密切。
基于数学近似的方法
H0:两样本服从正态分布,且不相关
准确服从高斯分布的数据
car_sales.sav
简单散点图
Person相关系数为-0.17,且显著性水平为0.837,不相关的假设成立
我的热门文章
即使是一小步也想与你分享

我要回帖

更多关于 spss双变量相关性分析 的文章

 

随机推荐