两组数据为mean值和平均值的区别加减标准差,如何计算mean和sd的差值?

1、第第4章章 SPSS的均值比较过程的均值比较过程 SPSS主要有以下模块实现均值比较过程。主要有以下模块实现均值比较过程。 One-Sample T Test:单样本:单样本 t 检验。检验。 Independent-Sample T Test:两个独立样:两个独立样本均值的本均值的 t 检验。检验。 Paired-Sample T Test:两个配对样本均值:两个配对样本均值的的 t 检。检。4.1 SPSS在单样本在单样本t检验的应用检验的应用 1.使用目的 单样单样本t检验检验的目的是利用来来自某总总体的样样本数数据,推断该总断该总体的均值值是否与与指定的检验值检验值之间间存在明显显的差2、异异。它它是对总对总体均值值的假设检设检验验。2.基本原理 单样本单样本t检验作为假设检验的一种方法,其基本步检验作为假设检验的一种方法,其基本步骤和假设检验相同。其零假设为骤和假设检验相同。其零假设为H0:总体均值与:总体均值与指定检验值之间不存在显著差异。该方法采用指定检验值之间不存在显著差异。该方法采用t检验方法,按照下式计算检验方法,按照下式计算t统计量。统计量。 式中,式中,D是样本均值与检验值之差;因为总体方是样本均值与检验值之差;因为总体方差未知,故用样本方差差未知,故用样本方差S代替总体方差;代替总体方差;n为样本为样本数。数。 DtSn D 3.概概率P值值 如果概率如果概率3、P值小于或等于显著性水平,则拒值小于或等于显著性水平,则拒 绝零假设;绝零假设; 如果概率如果概率P值大于显著性水平,则接受零假设。值大于显著性水平,则接受零假设。 4.软软件使用方法(1)在)在SPSS中,软件将自动计算中,软件将自动计算t值,由于该统计量服从值,由于该统计量服从n-1个自由度的个自由度的t分布,分布,SPSS将根据将根据t分布表给出分布表给出t值对应值对应的相伴概率的相伴概率P值。值。(2)如果相伴概率)如果相伴概率P值小于或等于给定的显著性水平,则值小于或等于给定的显著性水平,则拒绝拒绝H0,认为总体均值与检验值之间存在显著差异。,认为总体均值与检验值之间存在显著差异。(4、3)相反,相伴概率值大于给定的显著性水平,则不应)相反,相伴概率值大于给定的显著性水平,则不应拒绝拒绝H0,可以认为总体均值与检验值之间不存在显著,可以认为总体均值与检验值之间不存在显著差异。差异。4.1.2 单样单样本t检验检验的SPSS操作详详解 Step01: 打开单样开单样本t检验对话检验对话框。 选择菜单栏中的选择菜单栏中的【Analyze(分析)(分析)】【Compare Means(比较均值)(比较均值)】【One-Sample T Test(单样本(单样本T检验)检验)】命令,弹出命令,弹出【One-Sample T Test(单样本(单样本T检验)检验)】对话框。对话框。St5、ep02: 选择检验变选择检验变量。 在该对话框左侧的候选变量列表框中选择一个或几个变在该对话框左侧的候选变量列表框中选择一个或几个变量,将其移入量,将其移入【Test Variable(s)(检验变量)(检验变量)】列表框列表框中。其中,左侧候选变量列表框中显示的是可以进行中。其中,左侧候选变量列表框中显示的是可以进行t检验的变量。检验的变量。Step03: 选择样选择样本检验值检验值。 在在【Test Value(检验值)(检验值)】文本框中输入文本框中输入检验值,相当于假设检验问题中提出的零假检验值,相当于假设检验问题中提出的零假设设H0: =0。Step04:其他选项设选项设置。 单击6、单击【Options】按钮,弹出按钮,弹出【One-Sample T Test:Options(单样本单样本T检验:选择检验:选择)】对话框。该对话框用于对话框。该对话框用于指定输出内容和关于缺失值的处理方法,其中各选项指定输出内容和关于缺失值的处理方法,其中各选项的含义如下。的含义如下。 Confidence Interval:该该文本框用于设设置在指定水平下,样样本均值与值与指定的检验值检验值之差的置信区间区间,默认值为认值为95%。【Missing Values(缺失值值)】选项组选项组:用于设设置缺失值值的处处理方式,它它有以下两种处两种处理方式。 Exclude cases anal7、ysis by analysis:点选该单选钮选该单选钮,表示当当分析计计算涉及到含有缺失值值的变变量时时,删删除该该变变量上是缺失值值的观测观测量。 Exclude cases listwise:点选该单选钮选该单选钮,表示删删除所有含缺失值值的观测观测量后再进进行分析。Step05:相关统计关统计量的Bootstrap估计计 单击单击【Bootstrap】按钮钮,在弹弹出的对话对话框中可以进进行如下统计统计量的Bootstrap估计计。 支持均值值和标标准差的Bootstrap 估计计。 支持平均值值差值值的Bootstrap 估计计和显显著性检验检验。Step06: 单击单击【OK】按钮8、结钮结束操作,SPSS软软件自动输动输出结结果。4.1.3 实实例图图文分析:交通通勤时间时间1. 实实例内内容 根据一份份公共交通调查报调查报告显显示,对对于那些在一个个城市乘车车上下班的人来说来说,平均通勤时间为时间为19分钟钟,其人数总数总量为为100万300万。假设设一个研个研究者居住在一个个人口为为240万的城市里,想通过验证过验证以确定通勤时间时间是否和其他城市平均水平是否一致。他随随机选选取了26名通勤者作为样为样本,收集的数数据如下所示。假设设通勤时间时间服从从正态态分布,这这位研研究者能得到什么结论么结论? 19 16 20 23 23 24 13 19 23 16 17 19、5 14 27 17 23 18 18 20 18 18 18 23 19 19 282 实实例操作 现在该名研究者要检验他所在城市的平均通勤时间和全现在该名研究者要检验他所在城市的平均通勤时间和全国其他城市平均水平是否一致。由于题目中已给出了其国其他城市平均水平是否一致。由于题目中已给出了其他城市通勤时间的平均水平为他城市通勤时间的平均水平为19分钟,因此,这里就是分钟,因此,这里就是要检验该城市通勤时间是否等于要检验该城市通勤时间是否等于19分钟,即进行如下假分钟,即进行如下假设检验:设检验: 0:19;Ht 1:19H tStep01:打开对话开对话框 打开数据文件打开数据文件4-1.s10、av,选择菜单栏中的,选择菜单栏中的【Analyze(分(分析)析)】 【Compare Means(比较均值)(比较均值)】【One-Sample T Test(单样本(单样本T检验)检验)】命令,弹出命令,弹出【One-Sample T Test(单样本(单样本T检验)检验)】对话框。对话框。 Step02:选择检验变选择检验变量 在候选变量列表框中选择在候选变量列表框中选择“time”变量,将其添变量,将其添加至加至【Test Variables(检验变量)(检验变量)】列表框中。列表框中。Step03:选择样选择样本检验值检验值在在【Test Value(检验值)(检验值)】文本框中输11、入检验值文本框中输入检验值“19” 。Step04:设设置显显著性水平单击单击【Options】按钮,在弹出的对话框的按钮,在弹出的对话框的【Confidence Interval Percentage(置信区间百分比)(置信区间百分比)】文本框中将系统默认文本框中将系统默认的的95修改为修改为 99,其目的是调整显著性水平。单击,其目的是调整显著性水平。单击【Continue】按钮返回主对话框。按钮返回主对话框。提示:如果不选择提示:如果不选择Options按钮,表示默认系统选项参数设置。按钮,表示默认系统选项参数设置。 Step05:结束操作 单击单击OK按钮,完成操作。此时,软件输出结果12、出现在按钮,完成操作。此时,软件输出结果出现在结果浏览窗口中。结果浏览窗口中。3. 实实例结结果及分析(1)描述性统计分析表)描述性统计分析表NMeanStd. DeviationStd. Error Mean通勤时间2619.53853.75479.73638(2)单样本)单样本t检验结果检验结果Test Value = 19 tdfSig. (2-tailed)Mean Difference99% Confidence Interval of the DifferenceLowerUpper通勤时间.73125.471.53846-1.51412.59114.1.4 实实例进阶进阶分析:机13、票的折扣1 .实实例内内容 1995年2月,某个个航班往返机票的平均折扣费费是258美元(今日美国国,1995年3月30日)。随随机抽取了在3月份份中15个个往返机票的折扣费费作为为一个简单随个简单随机样样本,结结果得到下面的数数据: 310 260 265 255 300 310 230 250 265 280 290 240 285 250 260 请你检验请你检验3月份份往返机票的折扣费费是否有所增加? 2 实实例操作 由于由于3月份机票的平均折扣费是月份机票的平均折扣费是258美元,而现在调查美元,而现在调查抽取了抽取了15个数据,可以计算得到它们的样本均值(个数据,可以计算得到它们的14、样本均值(Mean)等于)等于270美元。从数值大小看到明显折扣费用增加了。美元。从数值大小看到明显折扣费用增加了。但是,这种数值的增加是由实际情况变动还是抽样误差但是,这种数值的增加是由实际情况变动还是抽样误差造成的,则可以通过单样本的造成的,则可以通过单样本的t检验来验证。这里建立检验来验证。这里建立如下假设检验:如下假设检验:0:H1:H0:258;H price1:258H price由于单样本由于单样本t检验要求样本数据服从正态分布,因此进行单检验要求样本数据服从正态分布,因此进行单样本的样本的K-S检验,得到检验分析表。从检验结果看到,统检验,得到检验分析表。从检验结果看到,统计量15、计量Z等于等于0.697,相伴概率,相伴概率P等于等于0.716,远大于显著性水,远大于显著性水平,因此接受零假设,认为该数据服从正态分布,可以利平,因此接受零假设,认为该数据服从正态分布,可以利用单样本用单样本t检验方法。具体操作步骤如下。检验方法。具体操作步骤如下。表4-3 One-Sample K-S Test机票折扣费N15Normal ParametersaMean270.00Std. Deviation24.785Most Extreme DifferencesAbsolute.180Positive.180Negative-.087Kolmogorov-Smirnov Z.69716、Asymp. Sig. (2-tailed).716Step 01 打开数据文件打开数据文件4-2.sav,选择菜单栏中的,选择菜单栏中的【Analyze(分析)(分析)】 【Compare Means(比较均值)(比较均值)】【One-Sample T Test(单样本(单样本T检验)检验)】命令,命令,弹出弹出【One-Sample T Test(单样本(单样本T检验)检验)】对对话框。话框。Step02 在候选变量列表框中选择在候选变量列表框中选择“pirce”变量,将变量,将其添加至其添加至【Test Variables(检验变量)(检验变量)】列列表框中。表框中。 Step 03 在17、在【Test Value(检验值)(检验值)】文本框中输入检文本框中输入检验值验值“258”。 Step 04 单击单击【OK】按钮,完成操作。按钮,完成操作。 3. 实实例结结果及分析 下表所示为单样本下表所示为单样本t检验的分析结果,表格中各项的含义检验的分析结果,表格中各项的含义前面已经详细讲解了。由于这里双侧概率前面已经详细讲解了。由于这里双侧概率P值值0.082略大于略大于显著性水平显著性水平0.05,因此接受零假设,认为,因此接受零假设,认为3月份往返机票月份往返机票的折扣费没有变化。的折扣费没有变化。单样本单样本t t检验分析结果检验分析结果Test Value = 258 td18、fSig. (2-tailed)Mean Difference95% Confidence Interval of the DifferenceLowerUpper机票折扣费1.87514.08212.000-1.7325.734.2 SPSS在两独两独立样样本t检验检验的应应用4.2.2 两独两独立样样本t检验检验的SPSS操作步骤骤 Step01:打开两独开两独立样样本t检验对话检验对话框。 选择菜单栏中的选择菜单栏中的【Analyze(分析)(分析)】【Compare Means(比较均值)(比较均值)】【Independent- Samples T Test(独立样本(独立样本T检验)19、检验)】命令,弹出命令,弹出【Independent-Samples T Test(独立样本(独立样本T检验)检验)】对话框。对话框。 Step02:选择检验变选择检验变量 在左侧的候选变量列表框中选择检验变量,将在左侧的候选变量列表框中选择检验变量,将其移入其移入【Test Variable(s)(检验变量)(检验变量)】列表列表框中,这里需要选入待检验的变量。框中,这里需要选入待检验的变量。Step03:选择选择分组变组变量在左侧的候选变量列表框中选择分组变量,将在左侧的候选变量列表框中选择分组变量,将其移入其移入【Grouping Variable(分组变量分组变量)】文文本框中,目的是20、区分检验变量的不同组别。本框中,目的是区分检验变量的不同组别。Step04 定义组别义组别名称称 单击单击【Define Groups】按钮,弹出按钮,弹出【Define Groups(定(定义组)义组)】对话框,此时需要定义进行对话框,此时需要定义进行t检验的比较组别名称。检验的比较组别名称。 该对话框中各选项的含义如下。该对话框中各选项的含义如下。 Use specified values:分别输别输入两个对应两个对应不同总总体的变变量值值。 Cut point:用于定义义分割点值值。在该该文本框中输输入一个数个数字,大于等于该数值该数值的对应对应一个总个总体,小于该值该值的对应对应另一个21、总个总体。在该对话框中设置完成后,单击在该对话框中设置完成后,单击【Continue】按钮,返回按钮,返回【Independent-Samples T Test(独立样本(独立样本T检验)检验)】对对话框。话框。Step05:相关统计关统计量的Bootstrap估计计单击单击【Bootstrap】按钮,在弹出的对话框中可以按钮,在弹出的对话框中可以进行如下统计量的进行如下统计量的Bootstrap估计。估计。 支持均值和标准差的支持均值和标准差的Bootstrap 估计。估计。 支持平均值差值的支持平均值差值的Bootstrap 估计和显著性检估计和显著性检验。验。Step06 单击单击【OK22、】按钮,结束操作,按钮,结束操作,SPSS软件自动输软件自动输出相关结果。出相关结果。 4.2.3 实实例图图文分析:机场场等级级分数数比较较1. 实实例内内容 国际航空运输协会(国际航空运输协会(The International Air Transport Association)对商务旅游人员进行了一项调查,以便确定多个)对商务旅游人员进行了一项调查,以便确定多个国际机场的等级分数。最高可能分数是国际机场的等级分数。最高可能分数是10分,分数越高说分,分数越高说明其等级也越高。假设有一个由明其等级也越高。假设有一个由50名商务旅行人员组成的名商务旅行人员组成的简单随机样本,要求这些人给迈23、阿密机场打分。另外有一简单随机样本,要求这些人给迈阿密机场打分。另外有一个由个由50名商务旅行人员组成的样本,要求这些人给洛杉矶名商务旅行人员组成的样本,要求这些人给洛杉矶机场打分。这两个组人员打出的等级分数如表机场打分。这两个组人员打出的等级分数如表4-5所示。所示。请你判断迈阿密机场和洛杉矶机场的等级评分是否相同?请你判断迈阿密机场和洛杉矶机场的等级评分是否相同? 表表4-5 两组人员打出的等级分数两组人员打出的等级分数2 实实例操作 本案例中共有两组商务旅行人员分别对迈阿密和洛杉本案例中共有两组商务旅行人员分别对迈阿密和洛杉矶机场打分。由于这两组人员构成不同,因此由这矶机场打分。由于这两24、组人员构成不同,因此由这两组人员组成的样本可以看作是相互独立的。现在两组人员组成的样本可以看作是相互独立的。现在要比较这两个机场的平均得分是否相同,也就是要要比较这两个机场的平均得分是否相同,也就是要检验这两个独立样本的均值是否相同,因此可以采检验这两个独立样本的均值是否相同,因此可以采用两独立样本用两独立样本t检验的方法。于是建立如下假设检验:检验的方法。于是建立如下假设检验: H0 :迈阿密机场和洛杉矶机场的等级得分相同。:迈阿密机场和洛杉矶机场的等级得分相同。 H1 :迈阿密机场和洛杉矶机场的等级得分不同。:迈阿密机场和洛杉矶机场的等级得分不同。Step01:打开对话开对话框 选择菜单栏25、中的选择菜单栏中的【Analyze(分析)(分析)】 【Compare Means(比较均值)(比较均值)】【Independent-Sample T Test(独立(独立样本样本T检验)检验)】命令,弹出命令,弹出【Independent-Sample T Test(独立样本(独立样本T检验)检验)】对话框,。这里变量对话框,。这里变量score表示两个表示两个机场的得分;变量机场的得分;变量x是不同机场的标志变量,是不同机场的标志变量,1表示迈阿表示迈阿密机场,密机场,2表示洛杉矶机场。表示洛杉矶机场。 Step02:选择检验变选择检验变量 在左侧的候选变量列表框中选择检验变量在左侧的候选26、变量列表框中选择检验变量“score”,将其,将其添加至右侧的添加至右侧的【Test Variable(s)(检验变量)(检验变量)】列表框中,列表框中,表示需要对它进行独立样本的表示需要对它进行独立样本的T检验检验。 Step03:选择选择分组变组变量在左侧的候选变量列表框中选择分组变量在左侧的候选变量列表框中选择分组变量“x”,将其添加,将其添加至至【Grouping Variable(s)(组变量)(组变量)】文本框中。接着文本框中。接着单击单击【Define Groups】按钮,弹出按钮,弹出【Define Group(定(定义组)义组)】对话框。对话框。 提示:如果不单击提示:如果不27、单击【Options】按钮,表示默认系统选项按钮,表示默认系统选项参数设置。参数设置。 Step04:定义组别义组别名称称点选点选【Use specified values(使用指定值)(使用指定值)】单选钮,在单选钮,在【Group1(组(组1)】文本框中输入文本框中输入“1”,在,在【Group2(组(组2)】文本框中输入文本框中输入“2”。输入完成后,单击。输入完成后,单击【Continue】按钮返回。按钮返回。Step05:完成操作 单击单击【OK】按钮,完成操作。此时,软件输出结果出按钮,完成操作。此时,软件输出结果出现在结果浏览窗口中。现在结果浏览窗口中。 3. 实实例结结果及分析28、(1)基本统计信息汇总表)基本统计信息汇总表 (2)独立两样本的)独立两样本的t检验分析结果检验分析结果 两总体方差是否相等的两总体方差是否相等的F检验检验 这里,该检验的这里,该检验的F统计量的观察值为统计量的观察值为0.086,对应的概,对应的概率率P值为值为0.770。由于系统默认显著性水平。由于系统默认显著性水平为为0.05,而,而概率概率P值显然大于值显然大于0.05,因此认为两总体的方差无显著,因此认为两总体的方差无显著性差异。性差异。两总体均值的检验两总体均值的检验 在在SPSS中进行两独立样本中进行两独立样本t检验时,应首先对检验时,应首先对F检验作判断。检验作判断。如果方差相29、等,观察分析结果中如果方差相等,观察分析结果中Equal variances assumed列的列的t检验相伴概率值;如果方差不相等,观察检验相伴概率值;如果方差不相等,观察Equal variances not assumed列的列的t检验相伴概率值。本案例的第一步检验相伴概率值。本案例的第一步分析中,由于两总体方差无显著差异,因此应看第一列分析中,由于两总体方差无显著差异,因此应看第一列(Equal variance assumed)的)的t检验结果。具体来说,检验结果。具体来说,t统统计量的观测值为计量的观测值为-0.924,对应的双尾概率,对应的双尾概率P值为值为0.358,大,大于显30、著性水平于显著性水平0.05,因此认为两总体的均值不存在显著差,因此认为两总体的均值不存在显著差异,即迈阿密机场和洛杉矶机场的等级得分相同。这个结异,即迈阿密机场和洛杉矶机场的等级得分相同。这个结论说明商务人员认为两个机场在服务水平质量等方面是没论说明商务人员认为两个机场在服务水平质量等方面是没有差异的。有差异的。4.2.4 实实例进阶进阶分析:考试试中的惊惊惶失措 1. 实实例内内容 许多学生都有一次考试中因为第一道题目特别难而惊许多学生都有一次考试中因为第一道题目特别难而惊惶失措的不愉快经历。人们对考试题目的安排进行惶失措的不愉快经历。人们对考试题目的安排进行了研究,以弄清它对焦虑的影响。31、表了研究,以弄清它对焦虑的影响。表4-8所示的分数所示的分数是对是对“测验焦虑测验焦虑”的度量,有充分的证据支持考试的度量,有充分的证据支持考试题目的安排对分数有影响这一假设吗?题目的安排对分数有影响这一假设吗? 2 实实例操作 表表4-8列出了两种考试方式下不同学生的焦虑测量值,列出了两种考试方式下不同学生的焦虑测量值,其值越大,说明学生考试时越焦虑。现在要研究考试题其值越大,说明学生考试时越焦虑。现在要研究考试题目对分数的影响性,即比较这两种考试形式对学生有无目对分数的影响性,即比较这两种考试形式对学生有无显著的焦虑差异性。考虑到选取的学生不同,因此可以显著的焦虑差异性。考虑到选取的学生不32、同,因此可以利用两独立样本的利用两独立样本的t检验,建立假设检验如下。检验,建立假设检验如下。 H0:两种考试方式下学生的平均焦虑测量值相:两种考试方式下学生的平均焦虑测量值相 同。同。 H1:两种两种考试试方式下学学生的平均焦虑测虑测量值值不同。 Step01 建立数据文件建立数据文件4-4.sav。这里变量。这里变量anxiety表示表示两个机场的得分;变量两个机场的得分;变量x表示不同的考试方表示不同的考试方式,式,1表示问题从易到难安排,表示问题从易到难安排,2表示各问题表示各问题从难到易安排。从难到易安排。Step02 选择菜单栏中的选择菜单栏中的【Analyze(分析)(分析)】 33、【Compare Means(比较均值)(比较均值)】【Independent-Sample T Test(独立样本(独立样本T检验)检验)】命令,弹出命令,弹出【Independent-Sample T Test(独立样本(独立样本T检验)检验)】对话对话框。框。Step03 在左侧的候选变量列表框中选择检验变量在左侧的候选变量列表框中选择检验变量 anxiety,将其添加至,将其添加至【Test Variable(s)(检(检验变量)验变量)】列表框中。列表框中。Step04 选择分组变量选择分组变量x,将其添加至,将其添加至【Grouping Variable(s)(分组变量)(分组变量34、)】文本框中。文本框中。Step05 单击单击【Define Groups】按钮,弹出按钮,弹出【Define Group(定义组)(定义组)】对话框。点选对话框。点选【Use specified values】单选单选钮,在钮,在【Group1(组(组1)】文本框中输入文本框中输入“1”,在,在【Group2(组(组2)】文本框中输入文本框中输入“2”。输入完成后,单击。输入完成后,单击【Continue】按钮,关闭按钮,关闭【Define Group(定义组)(定义组)】对话框。对话框。Step06 单击单击【OK】按钮,结束操作按钮,结束操作。3. 实实例结结果及分析(1)基本统计信息汇35、总表)基本统计信息汇总表不同考试形不同考试形式式NMeanStd. DeviationStd. Error Mean焦虑测焦虑测量值量值问题从易到问题从易到难安排难安排2527.07526.869881.37398问题从难到问题从难到易安排易安排1631.72814.260151.06504两总体均值的检验两总体均值的检验 在首先进行的方差相等假设检验中,在首先进行的方差相等假设检验中,F统计量等于统计量等于1.986,对,对应的概率应的概率P值为值为0.167,大于显著性水平,大于显著性水平0.05,因此认为两组,因此认为两组数据的方差是相等的。于是接着观察数据的方差是相等的。于是接着观察“36、Equal variance assumed”列所对应的列所对应的t检验结果。由于检验结果。由于t统计量对应的双尾概率统计量对应的双尾概率P值为值为0.020,小于显著性水平,小于显著性水平0.05,因此认为两总体的均值存,因此认为两总体的均值存在着统计意义下的显著性差异。所以,问题在着统计意义下的显著性差异。所以,问题“从易到难从易到难”和和“从难到易从难到易”两种方式的题目设置安排,对学生考试产生了两种方式的题目设置安排,对学生考试产生了显著的焦虑影响,其平均焦虑值从显著的焦虑影响,其平均焦虑值从27.0752上升至上升至31.7281。所以,出题人在设置试卷考试难度的分配时,要予以充分的37、所以,出题人在设置试卷考试难度的分配时,要予以充分的考虑。考虑。4.3 SPSS在两两配对样对样本t检验检验的应应用4.3.1 两两配对样对样本t检验检验的基本原理 1.使用目的 前一节中考虑的是独立样本情形下的总体均值相等的前一节中考虑的是独立样本情形下的总体均值相等的检验问题。但在现实中,总体或样本之间不仅仅表检验问题。但在现实中,总体或样本之间不仅仅表现为独立的关系,很多情况下,总体之间存在着一现为独立的关系,很多情况下,总体之间存在着一定的相关性。当分析这些相关总体之间的均值关系定的相关性。当分析这些相关总体之间的均值关系时,就涉及到两配对样本的时,就涉及到两配对样本的t检验。检验。 38、2.基本原理 两配对样本两配对样本t检验的目的是利用来自两个总体的配对样本,检验的目的是利用来自两个总体的配对样本,推断两个总体的均值是否存在显著差异。推断两个总体的均值是否存在显著差异。它它和独立样本和独立样本t检检验的差别就在于要求样本是配对的。由于配对样本在抽样时验的差别就在于要求样本是配对的。由于配对样本在抽样时不是相互独立的,而是相互关联的,因此在进行统计分析时不是相互独立的,而是相互关联的,因此在进行统计分析时必须要考虑到这种相关性,否则会浪费大量的统计信息,因必须要考虑到这种相关性,否则会浪费大量的统计信息,因此对于符合配对情况的统计问题,要首先考虑两配对样本此对于符合配对情况的39、统计问题,要首先考虑两配对样本t检验。配对样本主要包括下列一些情况。检验。配对样本主要包括下列一些情况。(1)同一实验对象处理前后的数据。例如对患肝病的病人实)同一实验对象处理前后的数据。例如对患肝病的病人实施某种药物治疗后,检验病人在服药前后的差异性。施某种药物治疗后,检验病人在服药前后的差异性。(2)同一实验对象两个部位的数据。例如研究汽车左右轮胎)同一实验对象两个部位的数据。例如研究汽车左右轮胎耐磨性有无显著差异。耐磨性有无显著差异。(3)同一样品用两种方法检验的结果。例如对人造纤维在)同一样品用两种方法检验的结果。例如对人造纤维在60度和度和80度的水中分别作实验,检验温度对这种材料缩40、水率度的水中分别作实验,检验温度对这种材料缩水率的影响性。的影响性。(4)配对的两个实验对象分别接受不同处理后的数据。例如)配对的两个实验对象分别接受不同处理后的数据。例如对双胞胎兄弟实施不同的教育方案,检验他们在学习能力对双胞胎兄弟实施不同的教育方案,检验他们在学习能力上的差异性。上的差异性。 3.使用条条件 进行配对样本检验时,通常要满足以下三个要求。进行配对样本检验时,通常要满足以下三个要求。 (1)两组样本的)两组样本的样本容量要相同样本容量要相同; (2)两组样本的观察值)两组样本的观察值顺序不能随意调换顺序不能随意调换,要保,要保持一一对应关系;持一一对应关系; (3)样本来自的总41、体要)样本来自的总体要服从正态分布服从正态分布。 两配对样本两配对样本t检验的基本思路是求出每对数据的差值:如果检验的基本思路是求出每对数据的差值:如果配对样本没有差异,则差值的总体均值应该等于零,从该总配对样本没有差异,则差值的总体均值应该等于零,从该总体中抽取的样本均值也应该在零值附近波动;反之,如果配体中抽取的样本均值也应该在零值附近波动;反之,如果配对样本有差异,差值的均值就该远离零值。这样,通过检验对样本有差异,差值的均值就该远离零值。这样,通过检验该差值样本的均值是否等于零,就可以判断这两组配对样本该差值样本的均值是否等于零,就可以判断这两组配对样本有无差异性。有无差异性。 该检验42、对应的假设检验如下。该检验对应的假设检验如下。 H0:两总体均值之间不存在显著差异。:两总体均值之间不存在显著差异。 H1:两总体均值之间存在显著性差异。:两总体均值之间存在显著性差异。 检验中所采用的统计量和单样本检验中所采用的统计量和单样本t检验完全相同检验完全相同 4.3.2 两两配对样对样本t检验检验的SPSS操作详详解 Step01:打开两开两配对样对样本t检验对话检验对话框 选择菜单栏中的选择菜单栏中的【Analyze(分析)(分析)】【Compare Means(比较均值)(比较均值)】【Paired-Samples T Test(配对样本(配对样本T检检验)验)】命令,弹出命令43、,弹出【Paired-Samples T Test(配对样本(配对样本T检检验)验)】对话框。对话框。 Step02:选择选择配对变对变量 在在【Paired-Sample T Test(配对样本(配对样本T检验)检验)】对话框对话框左侧的候选变量列表框中选择一对或几对变量,将其移左侧的候选变量列表框中选择一对或几对变量,将其移入入【Paired Variables(成对变量)(成对变量)】列表框中,这表示列表框中,这表示系统将对移入的成对变量进行配对检验。系统将对移入的成对变量进行配对检验。Step03:其他选项选择选项选择 单击单击【Options】按钮,弹出按钮,弹出【Paired-Sa44、mples T Test: Options(配对样本(配对样本T检验:选择)检验:选择)】对话框。该对话框用于指定对话框。该对话框用于指定输出内容和关于缺失值的处理方法,其中各选项的含义如下。输出内容和关于缺失值的处理方法,其中各选项的含义如下。 Confidence Interval:用于设设置在指定水平下样样本均值与值与指定的检验值检验值之差的置信区间区间,默认值为认值为95%。 【Missing Values(缺失值值)】选项组选项组:用于设设置缺失值值的处处理方式,它它有以下两种处两种处理方式。Exclude cases analysis by analysis:点选该单选钮选该单选钮45、,表示当当分析计计算涉及到含有缺失值值的变变量时时,删删除该变该变量上是缺失值值的观测观测量。Exclude cases listwise:点选该单选钮选该单选钮,表示删删除所有含缺失值值的观测观测量后再进进行分析。Step04 相关统计关统计量的Bootstrap估计计 单击单击【Bootstrap】按钮,在弹出的对话框中可以进按钮,在弹出的对话框中可以进行如下统计量的行如下统计量的Bootstrap估计。估计。 支持均值和标准差的支持均值和标准差的Bootstrap 估计。估计。 支持相关性的支持相关性的Bootstrap 估计。估计。 检验表支持均值的检验表支持均值的Bootstrap 46、估计。估计。Step05 单击图单击图【OK】按钮,结束操作,按钮,结束操作,SPSS软件软件自动输出结果。自动输出结果。 4.3.3 实实例图图文分析:看电视电视和读书读书的时间时间 1. 实实例内内容 “每月读书读书俱乐乐部”的成员进员进行了一项调查项调查,以确信其成员员用于看电视电视的时间时间是否比读书读书的时间时间多。假定抽取了15个个人组组成的样样本,得到了下列有关关他们们每周观观看电视电视的小时数时数和每周读书时间读书时间的小时数时数的数数据,见见表4-11所示。你你能够够得到结论结论:“每月读书读书俱乐乐部”的成员员每周观观看电电视视的时间时间比读书读书的时间时间更多吗吗?2. 47、实实例操作 由于读书俱乐部的成员每人在每周可能既要看电视也要读书,由于读书俱乐部的成员每人在每周可能既要看电视也要读书,因此要分析看电视和读书时间差异性,其实就是进行如下假因此要分析看电视和读书时间差异性,其实就是进行如下假设检验。设检验。 H0 :俱乐部成员看电视和读书所消耗的时间相同。:俱乐部成员看电视和读书所消耗的时间相同。 H1 :俱乐部成员看电视和读书所消耗的时间不同。:俱乐部成员看电视和读书所消耗的时间不同。 由于抽样数据中,样本都进行了看电视和读书两个方面的时由于抽样数据中,样本都进行了看电视和读书两个方面的时间调查,它们的活动主体都是同一个人,因此,数据类型属间调查,它们的活动48、主体都是同一个人,因此,数据类型属于配对样本的类型,故利用配对样本于配对样本的类型,故利用配对样本t检验来分析。具体操检验来分析。具体操作步骤如下。作步骤如下。 Step01:打开对话开对话框 打开数据文件打开数据文件4-5.sav,选择菜单栏中的,选择菜单栏中的【Analyze(分析)(分析)】 【Compare Means(比较均值)(比较均值)】【Paired -Sample T Test(配对样本(配对样本T检验)检验)】命令,弹出命令,弹出【Paired -Sample T Test(配对样本(配对样本T检验)检验)】对话框。这里变量对话框。这里变量 “tv”表示成表示成员每周看电视49、的时间;变量员每周看电视的时间;变量“book”表示成员每周读书的时表示成员每周读书的时间。间。 Step02:选择选择配对变对变量 在左侧的候选变量列表框中依次选择检验变量在左侧的候选变量列表框中依次选择检验变量“tv”和变和变量量“book”,将其添加至,将其添加至【Paired Variable(s)(成对变(成对变量)量)】列表框中。这表示进行列表框中。这表示进行“tv”和和 “book”的配对的配对t检检验。验。Step03:完成操作单击单击【OK】按钮,完成操作。此时,软件输出结按钮,完成操作。此时,软件输出结果出现在结果浏览窗口中。果出现在结果浏览窗口中。3. 实实例结结果及分析50、(1)基本统计信息汇总表)基本统计信息汇总表MeanNStd. DeviationStd. Error MeanPair 1看电视小时数12.00154.5361.171看书小时数9.00153.586.926(2)相关性分析)相关性分析 表表4-13是进行两配对变量之间简单相关性分析结果输出表。是进行两配对变量之间简单相关性分析结果输出表。表中第三列表示样本容量,第四列表示看电视时间和看表中第三列表示样本容量,第四列表示看电视时间和看书时间的简单相关系数,第五列表示概率书时间的简单相关系数,第五列表示概率P值。从结果来值。从结果来看,看,“tv”和和“book”变量的相关系数等于变量的相关系数等于0.193,呈简单,呈简单正相关关系;同时相伴概率正相关关系;同时相伴概率P值值0.490大于显著性水平大于显著性水平0.05说明这两组样本相关性显著。说明这两组样本相关性显著。(3)两配对样本)两配对样本t检验结果表检验结果表Paired DifferencestdfSig.(2-tai
欢迎来小薇的日更公号科研显微镜,如果亲比较缺乏SCI写作经验,自己修改起来费时费力,效果还不一定好,时间久了创新性下降,可以请小薇进行评估,或修改润色哦。你知道吗?目前已经发表的涉及统计分析的医学类文章大约有一半的统计方法都是错误的。读者普遍认为当一篇文章出现在期刊上时,审稿人和编辑已经仔细审查了手稿的各个方面,包括统计方法。然而事实并非如此。大量临床或生物医学研究人员实际上并没有接受过生物统计学方面的正式培训。盲目信任已发表文献设计自己的实验并进行统计分析是不可靠的。今天小薇根据统计学相关文献,整理了一些基本的经验法则,可以用于评估已发表文章中统计数据的使用,当然也希望对你的数据分析有帮助。实验数据一般都总结成mean
SD,或SEM。SD代表标准偏差, SEM代表平均值的标准误差。这里有一个基本法则,即:大约68%的观测值将在平均值的1个标准差范围内,大约95%的观测值将在平均值的2个标准差范围内,上述情况适用于标准差。(能看懂吗?看不懂我们以下面这个例子解释一下)例如,一篇报道健康成年人的舒张压为 78 ± 6 mm Hg(mean ± SD)的文章,意味着大约95%的健康成年人的舒张压在2
6 mm Hg
78 mm Hg = 66-90 mm Hg。 “2 个标准差规则”是一个很好的经验法则:当观测值(或可以假设)同样可能高于或低于平均值并且更可能接近平均值而不是远离平均值时,大约95%它们将在均值两侧的2个标准差内。与标准差不同,均值的标准误差SEM不会总结观察值的可变性,也不会让读者深入了解观察值的范围。为什么大多数作者使用SEM来总结他们的数据?一是传统;其次,SEM总是小于标准差。如果作者报告了平均值和样本量的SEM,读者可以使用简单的公式计算标准差:例如,假设一篇文章报道九名健康成人的舒张压为78 ± 2 mm Hg(平均值 ± SEM)。应该包括大约95%的观察结果的舒张压范围是多少?平均值的SEM为2,样本量为9,因此标准偏差(SD)为 2 mm Hg
= 2 mm Hg
3 = 6 mm Hg。 答案是26 mm Hg
78 mm Hg = 66-90 mm Hg,结果和上一个例子一样。相反,如果将“2 个标准差规则”直接用到平均值和SEM来判断舒张压的范围,就应该是74-82 mm Hg (22 mm Hg
78 mm Hg),这个范围其实并不能反映常规的变化范围(范围过窄)。那么,SEM衡量的是什么呢? 在一个实验中,研究者很少研究一个群体中所有可能的成员,而只研究一个小的、有代表性的样本。从这样一个样本计算出的平均值是对真实平均值的估计,如果可以观察到总体的所有成员,就可以计算出真实平均值。*因为用于计算平均值的样本是由被研究总体中随机抽取的个体组成的,所以这个样本及其平均值没有什么特别之处。特别是,如果抽签的运气不同,研究人员就会抽取包含不同个人的样本,并计算出不同的平均值。同样地,偶然可能导致第三次观察收集和第三次相关的均值。这三个样本都有一个均值,每个样本均值都是真实总体均值的估计。理论上,人们可以计算出所有可能样本的平均值。一般来说,每一个样本均值都是不同的,但如果能够观察到总体的所有成员,那么所有的均值都会聚集在真实均值周围。所有可能样本均值的标准差就是SEM。因此,SEM并不像标准差那样量化观测值的可变性,而是样本均值估计真实总体均值的精度。也就是说,SEM量化了人们可以从样本中估计真实总体均值的确定性。最后回到舒张压的例子,九名健康成人的样本让读者有95%的信心相信所有健康成人的平均舒张压为74-82 mm Hg。过窄的数据范围并没有说明数据的真实可变性。因此,应该使用标准差SD而不是平均值的标准误SEM来总结数据。你学会了吗?欢迎关注关注我们,了解更多硬核干货!你在学习工作中还遇到什么相关的问题都可以关注并留言给小薇,小薇会一一给你解答的!您如果有数据或者针对课题的想法,但是不知道怎么成文的都可以联系小薇哦!欢迎戳

我要回帖

更多关于 mean值和平均值的区别 的文章

 

随机推荐