定量资料中均数的渐进显著性是什么意思思

定量数据分析笔记 - 简书
定量数据分析笔记
用stata算集中指数采用Stata系统自带数据库auto.dta。  一、集中趋势的统计描述  以变量price为例进行说明。  均数:采用mean price计算得。  算术均数、几何均数和调和均数可以采用means、ameans、gmeans、hmeans计算。  众数:没有对应的命令可以直接计算众数,但是可以通过几种策略进行变通计算。如通过egen x=mode(price); drop x,不过本例中price中没有相同的数值,所以无法计算众数;另外也可通过 contract price, freq(x); list price if x==r(max); restore 来显示。  中位数:centile price或tabstat price, s(med),当然tabstat还可以计算均数、样本量、标准差,标准误、方差、极差、四分位间距、变异系数、峰度系数、偏度系数等等很多指标。  不过采用Stata(summarize ,tabstat等命令)计算的峰度系数与Excel、SPSS和SAS计算的结果有所不同,原因是采用的公式不同,大家根据实际情况来选择。  二、离散趋势指标  极差(全距):tabstat price, s(r)  标准差:tabstat price, s(sd)  方差:tabstat price, s(v)  四分位间距:tabstat price, s(iqr)  变异系数:tabstat price, s(cv)  采用summarize , detail命令可以计算均数、标准差、峰度系数、偏度系数、多个百分位数。不加detial可以得到最大值、最小值。
回归分析一、概念介绍R?,又叫做决定系数(coefficient of determination),是来说明自变量解释因变量变化百分比的度量,R?越接近1,表示回归越成功。
pearson相关系数(Pearson‘s correlation coefficient),用字母r表示,主要描述线性相关强度的量,取值(-1,1)之间,当两个变量有很强的线性相关时,相关系数接近于1(正相关)
最小二乘法(least squares regression),最小二乘法就是寻找一条直线,使得所有点到该直线的垂直距离的平方和最小,也就是方差最小
X?分布(卡方分布)
t分布比较样本均值所代表的未知总体均值μ和已知总体均值μ1的异同。类型:独立样本t检验和配对样本t检验
week4正态分布:一条呈钟形的对称曲线。对于一个服 从正态分布的随机变量,它的均值、众数和中位 数相同,都在概率分布曲线的最高点上。其相对 频率从中间逐渐向两端递减。与中央极限定理的关系,是经典统计估计的基石。判断标准:1、看频数(百分比)分布形状;2、计算均 值(70.7)、中位数(70)与众数(70)。
均值决定正态分布中心的位置,标准差决定正太分布钟形的形状。标准差决定正态分布的钟形形状——标准差越大,钟形越扁平
标准正态分布:均值为0,标准差为1的正太分布为标准正太分布,亦称为Z分布,Z的单位与标准差的长度相同。一般正太分布值转为标准正太分布:Z=(x-μ)/σZ值在某一范围的概率即相应范围内概率分布曲线 下的面积。p(Z&1.96)stata表示为:display normal(1.96);p(Z&1.96)stata表示为:1-display normal(1.96),如计算全体员工成绩(μ=70.07,σ=10.27),想知道成绩位于均值到85之间的比例解:display normal((85-70.07)/10.27)-.5(其中原理就是先转化为标准正太分布值,然后求出标准下的面积,再减去平均值0.5);反过来如果想通过比例求出分数线,即已知Z值,求x,x=Zσ+μ,stata代码:dis invnormal(.9)10.27+70.07(求处于公司前10%的分数线)
检查变量是否正太分布
symmetry plot:对称图,用来判断样本数据的分布是否是对称的。symmetry plot在判断样本数据是否符合对称分布时会有一条reference line 即参考线,这是一条完美的对称分布数据,样本数据越接近这条线,越对称。stata命令:symplot varnameqnorm:画出一幅分位-正太标绘图,就是比较样本数据和正态分布数据在各个分位数上的差异kdensity:是一种估计对给定样本集合点随机变量分布的密度函数,属于非参数估计(参数估计指先验的假定数据符合某种特定的性态,如线性的、指数性态的等,由此判断数据样本是否符合这种分布),而非参数估计方法则不同,它对数据分布不附加任何假定,是一种从数据样本本身出发研究数据分布的方法。
抽样分布抽样误差:样本的统计值(statistic)与总体参数 (parameter)之间的差异中央极限定理:对于一个均值为μ,标准差为σ的总体,无论它本身是否服从正太分布,如果无数次从总体中抽取样本量为n的样本,随着n 的增大,那么样本均值的分布将服从均值为μ,标准差为σ/根号n的正太分布,即:
比例的抽样分布:对于一个某特定时间发生比例为π的总体,如果从中无限次抽取样本量为n的样本,那么随着n的增大,样本比例P的分布将服从均值为π,标准差为 根号下π(1-π)/n,即
例题:某公司男女人数相同,现在随机抽取100名员工,问样本中男人人数大于等于60人概率是多少?dis sqrt(0.5*0.5/100) #求出标准差为0.05,所以这是一个均值为0.5,标准差为0.05的正太分布dis (0.6-0.5)/0.05 #转化为标准正态分布,求出Z=0.2dis 1-normal(2) #求出的就是大于等于60%的面积=0.022
置信区间通过统计推断找到包括样本统计量在内的一个区间;即通过有限样本,估计出未知参数以多大的概率在某一区间内取值。根据样本均值分布特点,该区间被认为包含总体参数。
置信水平(1-α)总体参数落入某区间的概率。也就是“准确估计”的信心。而α称为错误水平。常用置信水平:95%、99%
计算置信区间的通用公式公式:点估计值+-(关键值)*(标准误差)点估计值,指样本统计值(均值、比例)关键值,指根据抽样分布和置信水平决定的一个固定值Z α/2,如95%的置信区间,Z α/2=±1.96标准误差是抽样分布的标准差:σ/sqrt(n)
均值的置信区间规律置信水平相同的情况下,样本量越大,区间越小;样本量相同的情况下,置信水平越高,区间越大 (这是因为由于数据样本相同,要想满足更高的置信水平,就必须有更大的置信区间,这样才能保证样本数据可以更正确的落入该区间)区间越大,总体均值落在其间的可能性越大,估计正确的概率越大(犯错误的可能性越小),但估计的精确度越小;区间越小,估计的精确度越大,但估计错误的概率也越大
求置信区间的stata命令dis 平均值+-关键值*(标准差/根号下样本量n)ci var,level()
小样本参数估计:t分布t分布:参数估计的过程中,当总体标准差未知时,我们使用样本的标准差代替。但是这种处理方式仅适用于样本数量较大时,样本数量小的话就会影响精度。因此,我们通常用t分布对小样本均值(比例)进行估计
t分布作用:比较样本均值所代表的未知总体均值μ和已知总体均值μ1的异同。类型:独立样本t检验和配对样本t检验
t分布公式和性质μ指平均值,s指样本标准差
小样本均值(比例)的置信区间
不同于大样本均值的置信区间关键值是Zα/2/,t检验的关键字是t α/2 ,下图为大样本均值和比例置信区间公式
t分布的使用只有当总体参数已知或者样本容量较大的时候,才使用z分布进行估计,否则使用t分布。一般情况下,在不确定的情况下,使用t分布,因为它更加保守
假设检验,也称作显著性检验,是利用样本统计值对关于总体参数的假设进行评估检验的方法和程序。原假设(null hypothesis),一个关于“没有显著差异”的陈述,记为H0(可以或不可以被拒绝)备择假设(alternative hypothesis),与原假设相互排斥的对立假设,即“有显著差异”的陈述,记为Ha。(是否被验证:如果原假设被拒绝,即可以被验证,如果原假设不能被拒绝,即没有被验证)
t值计算p,即拒绝原假设放错误的概率
显著性水平α
单尾假设和双尾假设选择双尾或单尾检验的标准:除非要强调检验的方向(如大于或小于),通常使用双尾检验,因为它更保守双尾检验H0:μ=μ0 or μ-μ0=0H1:μ≠μ0 or μ-μ0≠0左尾检验H0:μ≥μ0 or μ-μ0≥0H1:μ<μ0 or μ-μ0<0右尾检验H0:μ≤μ0 or μ-μ0≤0H1:μ>μ0 or μ-μ0>0计算方式:现根据条件计算出t值(t= (x-μ)/(s/sqrt(n))),然后通过stata求出p=dis 2*ttail(n-1,t)如果p&α,就可以拒绝原假设,否则不能拒绝原假设
总体比例(π)的假设检验用于类别(二项分布)变量检验过程和均值假设检验一致关键值t的计算公式t=(p-π)/sqrt(P(1-P)/n)(π:特定事件发生的比例为π)
双变量和多变量分析单变量分析,对单一变量的描述和推论统计分析双变量分析,对两个变量之间的关系~多变量分析,对三个或更多个变量之间的关系~
自变量(independent variable)和因变量(dependent variable)双变量分析,一个自变量一个因变量多变量分析,一个因变量,两个或以上个自变量结构方程模型,有超过两个的自变量和因变量
双变量分析
T检验T检验,两个变量,因变量为定距-定比变量,自变量为定类-定序变量,且自变量只有两类(如男性和女性,城市和乡村,盈利与亏损等),典型的T检验:检验两个群体(两类)的均值是否有显著差异,如收入是否有显著性别差异;扩展1:检验一个变量的均值跟一个设定值之间是否有显著的差异(即前面的假设检验内容);扩展2:检验两个变量的均值是否有显著差异(配对样本)
T检验,stata命令检验均值与一个设定值的差异:ttest varname=x,level=(#)均值与设定值检验方法二:计算t检验 ttesti obs mean std μ(设定值),level(#)方法三:通过求出置信区间,看设定值是否落入区间来判断:ci varname,level()检验两个子群体均值的差异:ttest varname,by (group)检验两个变量均值的差异:ttest varname1=varname2
检验两个群体的均值差异stata命令验证:ttesti obs1 mean1 sd1 obs2 mean2 sd2,unequal
求出t值后,计算p值 p=dis 2*ttail(obs1+obs2-2,t)注意下面
比较两个变量均值:配对样本ttest varname1=varname2
想法太多读书太少的人当前位置: >>
第06章定量资料的分析
第6章定量资料的分析在 2.2、2.3 节介绍了定量资料的统计描述,4.2 节介绍了均数的可信区间,本章介绍 均数的假设检验。包括 t 检验和方差分析等。§ 6.1 样本均数与总体均数的比较样本均数 X 与总体均数?0 比较的目的, 是推断该样本是否来自某已知总体; 这一涵义 的另一种表达方式是:
样本均数 X 代表的总体均数?是否与已知总体均数?0 相等。这里的 总体均数?0 一般为理论值、标准值或经大量观察所得并为人们接受的公认值、习惯值。 解决这个问题有两种思路。其一:运用第 4 章介绍的可信区间估计方法,若由样本信 息估计的总体均数之可信区间没有覆盖已知的总体均数?0,则可推断该样本并非来自已知 均数的总体。其二:运用第 5 章介绍的假设检验的思路,先假设样本均数 X 代表的总体均 数? 等于某已知总体均数?0,再判断样本提供的信息是否支持这种假设,若不支持,则可 推断该样本并非来自该已知均数的总体。 可信区间估计与假设检验是统计学中两种重要的、独特的思维方式,它们在原理上是 相通的,均基于抽样误差理论,只是考虑问题的角度不同。在实际工作中,假设检验与可 信区间估计可以联合使用。 6.1.1 样本均数与总体均数的比较 例 6.1 测得 25 例某病女性患者的血红蛋白(Hb),其均数为 150(g/L),标准差为16.5(g/L)。而该地正常成年女性的 Hb 均数为 132(g/L)。问该病女性患者的 Hb 含量是否与 正常女性 Hb 含量不同? 本例为样本均数与已知总体均数的比较, 其目的是推断病人的平均血红蛋白(未知总体 均数?)与正常女性的平均血红蛋白(已知总体均数?0)间有无差别。从资料提供的信息来看, 样本均数 150 与总体均数 132 并不相等,究其原因可能有以下两个方面: ① 样本对应的总体均数等于 132,差别仅仅是由于抽样误差所致; ② 除抽样误差外,病人与正常人间存在本质上的差异。 以上两种情况只有一个是正确的,且二者必居其一,需要我们作出推断。一般来说,抽样 误差比本质上的差别要小, 且抽样误差是有规律的。 X 与? 间的差别究竟对应于上述①和 ②中的哪种情形,可以通过假设检验作出判断。其步骤如下。-62- (1) 建立假设(在假设的前提下有规律可循)。假设病人的平均血红蛋白含量与正常人 的相等,该假设被称为零假设(null hypothesis),记为 H0,表示目前的差异是由于抽样误差 引起的,对应于上述第①种情况。当这个假设 H0 被拒绝时,另一个与之对立的假设就被 接受,即病人的平均血红蛋白含量与正常人的不等,该假设被称为备择假设(alternative hypothesis),记为 H1,表示目前的差异是由于本质上的差别引起的,对应上述第②种情况。 两种假设可表示为: H0:?=132,病人与正常人的平均血红蛋白含量相等; H1:?≠132,病人与正常人的平均血红蛋白含量不等。 其中 H0 假设比较单纯,且在该假设的前提下有明确的规律可循。而 H1 假设包含的情 况比较复杂。因此,假设检验是针对 H0 的。 (2) 确定检验水准? (确定最大允许误差)。设定检验水准的目的就是确定拒绝假设 H0 时的最大允许误差。医学研究中一般取?=0.05。参见 5.4.4 节。 (3) 计算检验统计量(计算样本与总体的偏离)。样本均数 X 与总体均数?0 间的差别t? X ? ?0 s n可以用检验统计量 t 来表示: (6.1)统计量 t 表示:在标准误的尺度下,样本均数 X 与总体均数?0 的偏离。这种偏离称为标准 t 离差(standard t deviation)。根据抽样误差理论,在 H0 的假设前提下,统计量 t 服从自由度 为 n-1 的 t 分布,即 t 值在 0 附近的可能性大,远离 0 的可能性小,离 0 越远可能性越小。 相比之下,在 H1 的假设前提下没有如此简单、明确的规律。参见 3.4 节。 本例,已知 n=25, X =150(g/L),s=16.5(g/L),?0=132(g/L),则: X ? ? 0 150 ? 132t? ? ? 5.4545 s n 16.5 25(4) 计算概率 P(与统计量 t 值对应的概率)。根据第(3)步算得现有样本与已知总体的 标准 t 离差为 5.4545。该信息是否支持零假设 H0 ? 需要计算 P 值,即在 H0 成立的前提下, 获得现有这么大的标准 t 离差以及更大离差(即 | t | ≥5.4545)的可能性: P=P(| t | ≥5.4545) 按? =25-1=24 查附表 2 的 t 界值表,得双侧 t0.05,24=2.064,故 P<0.05。 (5) 结论(根据小概率原理作出推断)。根据 t 分布曲线下面积的分布规律(抽样分布规 律),在 H0 成立的前提下出现现有差别或更大差别的可能性 P(| t | ≥5.4545)小于 0.05,是 小概率事件,这种事件在仅仅一次试验中就发生被认为是不大可能的。然而不太可能发生 的事件在一次试验中居然发生了, 即现有样本信息不支持 H0。 因此, 拒绝 H0。 P>0.05, 若 说明在 H0 成立的前提下出现现有差别或更大差别的可能性不是小概率事件,因此,没有 理由拒绝 H0。可见,抉择的标准为: 当 P≤? 时,拒绝 H0,接受 H1; 当 P>? 时,不拒绝 H0。 本例 P<0.05,按? =0.05 的水准,拒绝 H0,接受 H1,差别有统计学意义,故可认为 该病女性患者的 Hb 含量高于正常女性。-63- 以上围绕一个实例阐述了假设检验的思维模式及其分析步骤。可见假设检验独特的思 维是,先根据研究目的建立假设,再分析样本提供的信息是否支持这种假设,最后作出推 断性结论。 6.1.2 配对设计定量资料的差值均数与总体差值均数 0 的比较 配对设计有两种情况:(1) 自身配对:同一对象接受两种处理,如对同一标本同时用 两种方法进行检验,同一患者先后接受两种处理方法;(2) 异体配对:将条件相近的实验 对象配对,并分别给予两种处理。在进行配对资料的 t 检验时,首先应求出各对数据间的 差值 d,将 d 作为变量值计算均数。若两处理因素的效应无差别,则理论上差值 d 的总体 均数?d 应为 0,故可将该检验理解为样本均数 d 与总体均数?d =0 的比较。 例 6.2 现用两种测量肺活量的仪器对 12 名妇女测得最大呼气率(PEER)(L/min), 资料 如表 6.1,问两种方法的检测结果有无差别?表 6.1 被测者号 (1) 1 2 3 4 5 6 7 8 9 10 11 12 合计 用两种方法对 12 名妇女的最大呼气率检测结果(L/min) Mini 法 (3) 525 415 508 444 500 460 390 432 420 227 268 443 DD 差值 d (4)=(3)-(2) 35 18 -4 43 30 45 -41 3 0 -48 103 22 206 d2 (5)
484 21426Wright 法 (2) 490 397 512 401 470 415 431 429 420 275 165 421 DD本例为同一受试对象(每一妇女)接受了两种试验仪表器的测量,所得数据为配对定量 资料,可用配对资料的 t 检验进行均数比较的假设检验。这时,t 值计算公式为:t? sd d n(6.2)上式中 d 为差值均数, s d 为差值标准差,n 为差值的个数, s d 假设检验步骤如下: H0:?d=0,两仪器检验结果相同; H1:?d≠0,两仪器检验结果不同。n 为差值均数的标准误。? =0.05。已知 n=12,d ? ? d n?2 0 6 1 2 1 7 . 1 7 ( L / m i n ) ?差值的标准差为:-64- sd ?? d ? ?? d ?22nn ?117.17 40.33 12 ? 1.48?21426 ? ? 206 ? 12212 ? 1? 40.33(L/min)则检验统计量: t ?按? = n-1=12-1=11 查附表 2 的 t 值表,得双侧 t0.20,11=1.363,双侧 t0.10,11=1.796,t0.10,11>t >t0.20,11,则 0.20>P>0.10,按? =0.05 的水准,不拒绝 H0,差别无统计学意义,故尚不能 认为两种仪器检查的结果不同。 例 6.3 某医生研究脑缺氧对脑组织中生化指标的影响,将乳猪按出生体重配成 7 对, 一组为对照组,一组为脑缺氧模型组。试比较两组猪脑组织钙泵的含量有无差别。表 6.2 对子号 1 2 3 4 5 6 7 合计 对照组 0.0 0.0 0.0 0.3050 DD 两组乳猪脑组织钙泵含量(? g/g) 实验组 0.5 0.0 0.5 0.2870 DD 差值 d 0.5 0.0 0.5 0.6 d2 0........033211本例在设计时,将两出生状况相近的乳猪配成一对,并将它们随机分作两组,一只做 缺氧处理,另一只为对照,所得数据为配对定量资料,故用配对 t 检验进行处理。 前面两个例子的 H1 假设均从两个方向偏离 H0,故称为双侧检验。如果专业理论上能 说明其中一侧不可能出现,则只需比较其中一侧,即称为单侧检验。参见 5.5.2 节。 对本例资料,生理试验已经证明,缺氧不会使乳猪脑组织钙泵含量增加。因此,选用 单侧检验。 H0:?d=0,即两组乳猪脑组织钙泵含量相等; H1:?d>0,即对照组乳猪脑组织钙泵含量高于实验组。 单侧? =0.05。 已知 n=7, d ? ? d n ? 0.3086 7 ? 0.0441 ?g / g ) ( 差值的标准差为:sd ?? d ? ?? d ?22n?n ?1d sd n?0.033211 ? ? 0.3086 ? 727 ?10.0441 ? 2.0412? 0.05716(μg/g)则检验统计量: t ?0.05716 7按?= n-1=7-1=6 查附表 2 的 t 界值表, 得单侧 t0.05,6=1.943, 0.05,6, P<0.05, ? =0.05 t>t 则 按 的水准,拒绝 H0,接受 H1,差别有统计学意义,故可认为脑缺氧可造成钙泵含量的降低。-65- § 6.2 两样本均数的比较有些研究既不能用自身配对设计,也不便用异体配对设计,而只能把独立的两组相互 比较。例如手术组与非手术组、新药组与对照组。两个样本均数比较的目的在于推断两个 样本所代表的两总体均数?1 和?2 是否相等。此时,t 检验的公式为:t? X1 ? X 2 s X1?X 21?X 2(6.3)式中 X 1 和 X 2 为两样本均数, s X为均数之差的标准误: (6.4)?1 1 ? s X 1 ? X 2 ? sc 2 ? ? ? ? ?n n2 ? ? 1 ?sc 2 为两样本合并方差,是两样本方差的加权平均(以自由度为权重):sc2(n ? 1) s1 ? (n 2 ? 1) s 2 ? 1 n1 ? n 2 ? 222(6.5)n1 和 n2 是两组的样本含量,按自由度?=n1+n2-2 的 t 分布界定 P 值并作出推断结论。 例 6.4 某医生为研究转铁蛋白对病毒性肝炎诊断的临床意义,测得 12 名正常人和 15 名病毒性肝炎患者血清转铁蛋白含量(?g/dl),资料见例 4.3。问患者和正常人转铁蛋白 含量是否有差异? H0 :?1=?2,正常人与病毒性肝炎患者的平均转铁蛋白含量相等; H1 :?1≠?2 ,正常人与病毒性肝炎患者的平均转铁蛋白含量不等。? =0.05。因X1 ?X2 ?? X1? X2n2n1??3262.7 ? 271.89 , 123528 1 . ? 235.21 , 15s12=10.382 s22=14.392则:sc 2 ?11? 10.382 ? 14? 14.392 ? 163.3679 12 ? 15 ? 2计算检验统计量:t? 271.89 ? 235.21 163.3679? ?1 12 ? 1 15? ? 7.402?=n1+n2-2=12+15-2=25按自由度 25 查附表 2 的 t 界值表,得 t0.001,25=3.725,t>t0.001,25,P<0.001,按? =0.05 的水 准,拒绝 H0,接受 H1,差别有统计学意义,故可以认为病毒性肝炎患者的转铁蛋白含量 低于正常人。 由于 t 分布在自由度较大时逼近标准正态分布,所以,在两个样本均数比较时,若两 组样本含量均很大,亦可用 u 检验,其计算公式为:-66- u?X1 ? X 2 ? s X 1? X 2X1 ? X 2 s12 n1 ? s 2 2 n2(6.6)u 为标准正态离差,按正态分布计算 P 值并作出推断结论。 例 6.5 某市于 1973 年和 1993 分别抽查了部分 12 岁男童,并对其发育情况了进行评 估,其中身高的有关资料如下,试比较这两个年度 12 岁男童身高均数有无差别。 1973 年:n1=120 1993 年:n2=153X 1 =139.9cm X 2 =143.7cms1=7.5cm; s2=6.3cm。H0 :?1=?2,即该市两个年度 12 岁男童平均身高相等; H1 :?1≠?2,即该市两个年度 12 岁男童平均身高不等。? =0.05。按式(6.6): s X 1 ? X 2 ? s1 计算检验统计量:2n1 ? s 22n2 ? 7.5 2 / 120 ? 6.3 2 / 153 ? 0.8533u?X1 ? X 2 sX 1 ? X 2?139.9 ? 143.7 0.8533? 4.4533 >u0.01=2.58得 P<0.01, ? =0.05 的水准, 按 拒绝 H0, 接受 H1, 差别有统计学意义, 故可认为该市 1993 年 12 岁男童平均身高比 1973 年高。§ 6.3 t 检验的正确应用6.3.1 t 检验的应用条件t 检验是定量资料分析中最为常用的方法,因此其正确应用也显得尤为重要。 (1) 资料的代表性与可比性 资料的代表性与可比性是进行统计分析的最基本要求,所谓代表性是指该样本从相应 总体中经随机抽样获得,能够代表总体的特征;可比性是指各对比组间除了要比较的主要 因素外,其它影响结果的因素应尽可能相同、相似或相近。为了保证资料的可比性,必须 要有严密的实验设计, 保证样本随机抽取于同质总体, 这是假设检验得以正确应用的前提。 参见第 13 章。 (2) t 检验的应用条件 应用 t 检验对两样本均数进行比较时,要求原始数据满足如下 3 个条件:① 独立性 (independence):各观察个体间是相互独立的,不能相互影响,亦不能一方影响另一方;② 正态性(normality):两组均数比较时,要求两组数据服从正态分布;配对设计时,要求差 值服从正态分布。可用正态性检验来确认(见第 9 章)。③ 方差齐性(homogeneity):两样本 所对应的正态总体之方差相等,可由方差齐性检验来认定(见 6.5 节)。 实际应用中, 检验数据独立性的统计方法比较复杂, 一般根据资料的性质判断, 例如, 遗传性、传染性皆可影响观察单位间的独立性,对同一观察对象的重复观察值之间亦是非-67- 独立的,如果不是研究因素,应予排除。t 检验对资料的正态性具有一定的稳健性(robust), 即资料稍许偏离正态分布,对结果影响不大;但是,如果偏离很大(如 L 型分布的资料), 尤其在样本含量不大时,则需考虑适当的变量变换,或选用第 8 章的方法。若两组的方差 不齐,则可用 t? 检验(见 6.3.2 节)。 (3) t 检验与 u 检验 在 3.4 节已经介绍,随自由度的增加,t 分布逐渐趋向于标准正态分布。因此,u 检验 是 t 检验的一种近似检验方法。当自由度大于 50 时,近似程度已经比较满意。但样本含量 较小时,两者出入较大。 (4) 结论不能绝对化 t 检验的结果不但取决于被研究事物有无本质差异, 而且还受抽样误差的大小(它又取 决于个体变异的程度和样本含量的大小)和选用检验水准高低的影响,例如在实际工作中, 对同一问题选用?的大小往往有一定的灵活性,有时按? =0.05 水准拒绝 H0;而按? =0.01 水准又可能不拒绝 H0;另外,取同一检验水准,就现有样本不拒绝 H0,但在增加样本含 量以后,由于抽样误差的缩小,又有可能拒绝 H0,因此,当 P 接近? 时,下结论要特别 慎重。此外,拒绝 H0 时要考虑到第一类错误,不拒绝 H0 时要考虑到第二类错误。参见第 5 章。 6.3.2 方差不齐时两样本均数比较的 t ? 检验 如果两样本方差齐性检验(见 6.5 节)认为两总体方差不等, 6.2 节介绍的 t 检验就不 则 适用了,此时可用 t ? 检验。 t ? 统计量的公式为:t? ?X1 ? X 2 s12 s2 2 ? n1 n2s X 1 2 ? t? ,?1 ? s X 2 2 ? t? ,? 2 sX 1 2 ? sX 2 2(6.7)t ? 检验的界值为:? t? ?(6.8)? 式中 t? ,?1 , t? ,? 2 分别是自由度为 ? 1 ? n1 ? 1 ,? 2 ? n2 ? 1 的 t 分布的双侧界值。 t? 实际上是 t? ,? 1 ? ? 和 t? ,? 2 的加权平均(以方差为权重) t ? & t? ,则 P&?,不拒绝 H0;若 t ? ≥ t? ,则 P≤?, 。若拒绝 H0,接受 H1。 6.3.3 两样本几何均数比较的 t 检验 有些单峰偏态分布的资料通过对数变换后成为正态分布或近似正态分布,这类资料的 平均水平可用几何均数来表示。比较两样本几何均数的目的是推断它们各自所代表的总体 几何均数有无差别。此时,先对原始数据 X 作对数变换 lnX,用公式(6.3)对变换后数据 lnX 作 t 检验即可。-68- § 6.4 多个均数的比较方差分析(analysis of variance, 简写为 ANOVA)又称变异数分析, 是进行多个均数比较 的常用方法之一。这种方法的基本思路是通过对变异进行分解和分析,从而达到统计推断 之目的。由于该方法是由英国统计学家 R.A. Fisher 于 1923 年首先提出的,因此又称为 F 检验。 6.4.1 方差分析的基本思想 前面介绍了配对资料的 t 检验和两样本均数的 t 检验,本节介绍的方差分析在应用上 可认为是这两种 t 检验的扩展,它可用于两组及两组以上数据的分析,其基本思想可用例 6.6 来说明。 例 6.6 某地用 A、B 和 C 共 3 种方案治疗血红蛋白含量不满 10g 的婴幼儿贫血患者。 A 方案为每公斤体重每天口服 2.5%硫酸亚铁 1ml,B 方案为每公斤体重每天口服 2.5%硫 酸亚铁 0.5ml,C 方案为每公斤体重每天口服 3g 鸡肝粉。治疗 1 个月后,记录下每名受试 者血红蛋白的上升克数, 资料见表 6.3, 3 种治疗方案对婴幼儿贫血的疗效是否有差别? 问表 6.3 3 种方案治疗婴幼儿贫血的疗效观察 治疗方案 A (n=20) B (n=19) C (n=20) 1.8 1.4 0.2 0.0 2.1 -0.7 0.5 1.2 0.5 1.6 1.9 1.3 2.3 2.3 0.3 3.0 1.7 1.1 3.7 0.7 1.9 1.6 0.2 0.2 血红蛋白上升值(g) 2.4 0.5 1.0 0.0 2.0 0.7 2.0 1.4 2.4 3.0 1.5 0.9 1.5 1.7 -0.4 0.7 0.9 0.8 2.7 3.0 2.0 1.2 1.1 -0.3 1.1 3.2 1.6 0.7 -0.2 0.7 0.9 2.5 2.01.3 1.4对于例 6.6 的 3 组数据,可将变异分为 3 类: (1) 总变异(SS 总):通过治疗后 59 个贫血婴儿的血红蛋白上升程度各不相同,这种变 异为总变异,其大小可用每一个变量值 Xij 与总均数 X 的离均差平方和(sum of squares of 2 deviations from the mean 简写为 SS)来表示,即 SS总 ? ? ? ?X ij ? X ? ,显然,SS 总的大小还 与总例数 N 的大小有关(确切地说与总自由度?总=N-1 有关,N=Σ ni,ni 为各组样本含量)。 (2) 组间变异(SS 组间): 3 种治疗方案(3 组间)血红蛋白上升的平均水平 X i 也不相等, 这种变异称为组间变异(between-group variation),它既可能包含不同治疗方案对血红蛋白 上升程度的影响(不同治疗方案疗效可能不同),也包括了随机误差,其大小可用各组均数X i 与总均数 X 的离均差平方和表示,即 SS组间 ? ? ni X i ? X??2,SS组间的大小也与各组例数的多少有关,其组间自由度?=k-1(k 为组数,本例 k=3),为消除例数的影响,可计算组间 均方:MS 组间 =SS 组间/(k-1)。 (3) 组内变异(SS 组内):3 个治疗组组内的血红蛋白上升值也不一致,这种变异称为组-69- 内变异(within-group variation),它反映了血红蛋白上升值的随机误差(包括个体差异和其它 随机因素的干扰), 其大小可用 3 组中每一组的每个变量值 Xij 与该组均数 X i 的离均差平方 和来表示, SS 组内 ? ?? ?X ij ? X i ?2 。 组内的大小也与各组例数 ni 有关, 即 SS 其自由度?组内为 N-k(其 中 N=Σ ni,k 为组数),因此组内均方为 MS 组内=SS 组内/(N-k)。 上述 3 种变异的关系可表示为: SS 总=SS 组间+SS 组内 ,?总=?组间+?组内 如果 3 种治疗方案效果相同,也即 3 组样本来自同一总体(H0:?1=?2=?3),那么从理 论上说组间变异应该等于组内变异,因为两者均只反映随机误差(包括个体差异)。这时计 算组间均方与组内均方的比值: F= MS 组间 /MS 组内 (6.9) 但由于抽样误差的影响,F 值并不正好等于 1,而是接近于1。相反,若 3 种疗法效果不 同,则组间变异就会增大,F 值亦将明显大于 1,要大到什么程度才有统计学意义呢?可 通过查附表 4,方差分析用 F 界值表得到 P 值,将其与事先规定的?值比较后作出判断。 由此可见,方差分析是从分析资料的变异来源入手,进而比较各种变异(组间和组内变异) 的相对大小,再作出统计学结论的一类方法。 方差分析的优点归纳起来有 3 点: (1)不受比较组数的限制; (2)可同时分析多个因素的 作用;(3)可分析因素间的交互作用。这些问题将在本章和第 14 章中陆续讨论。 总之,方差分析的意义是按照实验设计把总变异分成若干部分,划分得越细,各部分 的涵义越明确,对结论亦较易解释;同时,残余的变异即误差部分越小,因而能够提高检 验的灵敏度和结论的准确性。 6.4.2 单因素多个样本均数的比较 在一些医学研究中,研究的处理因素只有 1 个。例如,在对贫血儿童的不同治疗方案 的疗效研究中,要研究的处理因素只有 1 个,即治疗方案;在给予不同饲料后观察大鼠体 重的变化时,要研究的处理因素是饲料种类。单因素方差分析(one-way analysis of variance 或 one-way ANOVA)就是适用于对多个均数资料作分析的统计方法,这类研究的设计为完 全随机设计。 表 6.3 资料中 3 个样本均数分别为 X A =1.840, X B =1.1.226, X C =0.930,而用 3 种方 案治疗婴幼儿贫血病人 1 个月后血红蛋白升高的总体均数?A、?B、?C 是未知的,对这份资 料作方差分析,实际上就是通过对 3 个样本均数进行假设检验,来判断 3 个总体均数是否 相等。 在统计学上,往往先假设 H0:?A=?B=?C,即各总体均数相等,然后通过样本数据计 算 F 值。步骤如下: 设各组样本含量、均数、合计分别为:ni、 X i 和 ? X i ,i =1,2,?,k。总样本含量为 N=n1+n2+…+nk,总合计为 ? X ,总均数为 X 。 为计算方便,先计算 C 值:C ? ?? X ? N2(6.10)-70- 计算总的离均差平方和 SS 总:SS总 ? ? X 2 ? C(6.11)计算组间变异,即组间离均差平方和 SS 组间:SS组间 ? ? ni X i ? X?? ? ? ??nX ?2 i i2?C(6.12)计算组内变异,即组内离均差平方和 SS 组内:SS组内 ? ? si 2 ?ni ?1? ? SS总 ? SS组间(6.13)则根据(6.9)计算 F 值。再算得在 H0 成立的前提下,获得该 F 值及更大 F 值的概率 P, 若 P≤?,则可判断 H0 并不成立,而接受 H1;相反,若 P>?,说明上述概率并不太小, 还不能认为 H0 不成立,故不拒绝 H0。 例 6.7 对例 6.6 资料进行 3 样本均数比较的方差分析。 (1) 建立假设: H0:?A=?B=?C,3 种治疗方案治疗婴幼儿贫血的疗效相同; H1:3 种治疗方案治疗婴幼儿贫血的疗效不同或不全相同。?=0.05。(2) 计算各组基础数据: ? X i 、 ? X i 2 、 X i 和 si ,见表 6.4。表 6.4 例 6.6 资料方差分析的基础数据 A B 23.30 47.01 1.226 1.0121 C 18.60 28.86 0.930 0.7801 总和 78.70 159.43 1.334 0.9689? Xi ? Xi2Xisi36.80 83.56 1.840 0.9133(3) 分别计算 SS 总,SS 组间,和 SS 组内。 总变异: 组间变异: 组内变异: C =(78.70)2 /59=104.9778 SS 总=159.43-104.2 36.802 23.302 18.602 SS组间 ? ? ? ? 104.9778 ? 8. 20 SS 组内=0.9.0.7.8468 SS 组内=54.4=45.8468 (4) 列出方差分析表,见表 6.5。表 6.5 例 6.6 资料的单因素方差分析表 变异来源 总 组间 组内(误差) SS 54.4 45.8468也可从总变异减去组间变异得到组内变异:?58 2 56MSFP4.75.25550.0081-71- 表 6.5 中,总自由度为 N-1=59-1=58,组间自由度=组数(k)-1=3-1=2,组内自由 度 = 总 自 由 度 - 组 间 自 由 度 =58 - 2=56 。 各 均 方 MS=SS / ? , F=MS组间/ MS组内=4.7=5.2555,该 F 值分子的自由度?组间=2,分母的自由度?组内=56,查附表 4 方 差分析用 F 界值表得 F0.05(2,40)=3.18,F0.05(2,60)=3.15,用线性插值法近似估计:F0.05,(2,56) ? F0.05,(2,40) ? ? 3.18 ? F0.05,(2,60) ? F0.05,(2,40)60 ? 40? (56 ? 40)3.15 ? 3.18 ?16 ? 3.156 20F>F0.05(2,56),则 P<0.05(实际上 P=0.0081)。按? =0.05 的水准,拒绝 H0,接受 H1, 差别有统计学意义,故可认为三种治疗方案的治疗效果不一样。 上述结论仅说明 3 种治疗方案的效果总的说来有差别,并不表示任何两种治疗方案的 效果均有差别。若要了解各种治疗方案相互间有无差别,还需作进一步的两两比较。 6.4.3 多个样本均数的两两比较 在方差分析认为多组均数间差异有统计学意义的基础上,若需了解究竟哪些组均数之 间有差别,还是各组间均有差别,则可用多个样本均数的两两比较(又称多重比较 multiple comparison)。由于对比的组数 k 大于 2,若仍用前述 t 检验分别对每两个对比组作比较,2 则需经过 m= Ck ? k (k ? 1) / 2 次比较, 若每次比较的第一类错误率控制为?, 则多次比较后,2 至少犯一次第一类错误的概率为 1-(1-?)m,比预先设定的? 要大。比如,k=6,m= C6 =15次,若?=0.05,则至少一次错误地拒绝 H0 的概率为 1-(1-?)m=0.54,比 0.05 大多了。此时 易将无差别的两均数错判为有差别。故多个样本均数的两两比较不宜直接用前述 t 检验。 多个样本均数的比较可分为两种情况,一是各组间均要相互比较,以了解任何两组间 是否有差别;二是仅考虑某指定组与其它各组比较,例如有一组为对照组,意欲了解其它 各实验组与该对照组间是否有差别。多重比较的方法很多,这里介绍两种方法,即适用于 多组间两两比较的 q 检验,以及适用于某指定组与其它各组比较的 q? 检验。 (1) 多个样本均数间的两两比较 常用的统计方法为 q 检验(又称 Student-Newman-Keuls 法,即 SNK 法),统计量为 q:q? XA?XB??MS误差 ? 1 1 ? ?? ?n ? n ? ? 2 B ? ? A误差(6.14)式中 X A 、 X B 为两对比组的样本均数,MS 方),nA 和 nB 分别为两对比组样本例数。为方差分析中算得的误差均方(或称组内均例 6.8 续例 6.7。对 3 种治疗方案作两两比较。 H0:?A = ?B ,每次对比时两个总体均数相等; H1:?A≠?B ,每次对比时两个总体均数不等。?=0.05。将 3 个样本均数按从大到小顺序重新排列并编上组次:-72- 组次 均数 组别(治疗方案) 列出两两比较计算表 6.6。1 1.840 A2 1.226 B3 0.930 C表 6.6 3 个样本均数两两比较的 q 检验 对比组 (1) A与C A与B B与C 两均数之差 (2) 0.910 0.614 0.296 组 数a (3) 3 2 2 标准误 (4) 0.0 0.2050 q值 (5)=(2)/(4) 4.0 1.4457?=0.05(6) 3.408 2.836 2.836 (7) &0.05 &0.05 &0.05q 界值P表中第(1)列表示相互比较的两组。两两比较的次数为 3。 第(2)列为两对比组均数之差,例如,A 组与 C 组比, X A ? X C ? 1.840 ? 0.930 ? 0.910 ,余 类推。 第(3)列为 a 值,它表示样本均数按大小顺序排列时,两对比组所包含的组数。例如表 6.6 第一行 A 与 C 比,包含了 A、B、C 三个组,故 a=3,余类推。 第(4)列为 q 值的分母,本例已知 MS 误差=0.8187,各组例数不全相等,则对比时 q 值的 分母即标准误需分别计算。例如,A 与 B 对比时,nA=20,nB=19,则对比时 q 值的分母为:0.8187 ? 1 1 ? ? ? ? ? 0.2050 2 ? 20 19 ?余类推。 第(5)列为 q 值,按式(6.14)计算。 第(6)列由附表 8,q 界值表,查出?=0.05 时的界值。本例?误差=56,当 a=3 时,由于表 中无自由度为 56 的界值,故根据 q0.05,(40,3) ? 3.44 , q0.05,(60,3) ? 3.40 ,用线性插值法近似 估计:q0.05,(56,3) ? 3.408根据 q0.05,(40,2) ? 2.86 , q0.05,(60,2) ? 2.83 ,用线性插值法近似估计:q0.05,(56,2) ? 2.836第(7)列是根据第(6)列的数据得出的 P 值。按? =0.05 判断水准,A 组与 C 组、A 与 B 组对比时拒绝 H0,接受 H1,说明 A 方案与 B 方案、A 方案与 C 方案间均有差别;而 B 与 C 组对比时不拒绝 H0,说明就现有资料,尚不能说明 B 方案和 C 方案有差别。 (2) 多个实验组与一个对照组均数间的两两比较 常用 Dunnett 检验,其计算公式为:q' ? XT ? XC ? 1 1 ? MS误差 ? ? ? nT nC ? ?(6.15)上式中 X T 与 nT 为实验组均数和样本例数, X C 与 nC 为对照组均数和样本例数。算得 q'-73- 值后需查附表 9,q'界值表。q'界值表中的?仍为方差分析中误差项自由度,a 仍为两对比 组包含的组数。 例 6.9 设例 6.8 中的 A 组为对照组,B、C 两组为实验组,要求将 B 组、C 组分别与 对照组比较。 H0:对比的两组总体均数相等; H1:对比的两组总体均数不等。?=0.05。将样本均数从大到小排列,并编上组次: 组次 均数 组别 1 1.840 A(对照组) 2 1.226 B 3 0.930 C1 1 ? ) ? 2.(1) 比较对照组 A 与 B 组的均数:q ' ? ?1.840 ? 1.226 ? 0.8187(以?误差=56,a=2,查附表 9,q? 界值表,用线性插值法得 q'0.05(56,2)=2.004,q? >q? 0.05(56,2), P<0.05,故可认为 A、B 两种方案治疗幼儿贫血的效果有差别,A 方案优于 B 方案。 (2) 比较对照组 A 与 C 组的均数:q ' ? ?1.840 ? 0.930 ? 0. ? ) ? 3.139 20 19以?误差=56,a=3,查附表 9,q?界值表,用线性插值法得 q'0.05(56,3) =2.274,q?>q?0.05(56,3),P <0.05,故可认为 A、C 两种方案治疗幼儿贫血的效果不同,A 方案优于 C 方案。 6.4.4 两因素多个样本均数的比较 在有些情况下,研究者希望了解某种处理因素有无作用,但同时又存在可能对研究有 影响的另一因素,为了能反映该因素的作用(或排除这一因素的影响),同时真实地揭示出 处理因素的作用,就可进行两因素实验设计,其数据可作两因素多个样本均数的比较的方 差分析(或称两因素方差分析,two-way analysis of variance, two-way ANOVA),以达到提高 检验功效的目的。 例 6.10 在抗癌药筛选实验中,拟观察 3 种药物对小白鼠肉瘤(S180)的抑瘤效果,同 时设置了一对照组。用 20 只雄性小白鼠进行试验。由于 20 只雄性小白鼠来自 5 个不同窝 别,每窝 4 只。将同窝小白鼠随机分配至四个组,结果见表 6.7,问 3 种药物有无抑瘤作 用? 本例的主要目的是研究 3 种药物对小白鼠肉瘤(S180)的抑瘤效果,药物是处理因素。 但是,不同窝别的小白鼠对肉瘤生长的反应可能有差别,而这种差别若存在则必定会影响 对药物效应的分析,因此在实验设计时可将窝别因素视为干扰因素,并作为区组因素(亦 称配伍因素) 。在数据分析时,将处理因素的作用与干扰因素的影响分开,可提高检验的 功效。当然,有时区组因素也可能是实验的一个次要因素,也是实验者希望了解的。有关 区组设计的内容请参见 14.3 节。-74- 窝别(区组) Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ 处理组合计表 6.7 3 种药物抑瘤效果的比较(瘤重:g) A B C 对照 0.80 0.36 0.17 0.28 0.74 0.50 0.42 0.36 0.31 0.20 0.38 0.25 0.48 0.18 0.44 0.22 0.76 0.26 0.28 0.13区组合计 1.61 2.02 1.14 1.32 1.43 7.52( ? X ) 3.5688( ? X 2 )? Xi ? Xi23.09 2.09171.50 0.51961.69 0.62171.24 0.3358两因素方差分析的原理类似于单因素方差分析,前者仅在后者的基础上,从误差中再 分离出区组效应,使误差减少,达到提高检验功效之目的。其检验步骤如下: 实验因素: H0:3 种药物对小白鼠肉瘤(S180)的抑瘤效果与对照组相同,即?对照=?A=?B=?C; H1:3 种药物对小白鼠肉瘤(S180)的抑瘤效果与对照组不同或不全相同。? =0.05。干扰因素: H0:5 个窝别小白鼠对肉瘤生长的反应相同; H1:5 个窝别小白鼠对肉瘤生长的反应不同或不全相同。?=0.05。计算统计量: (1) 计算 C 值:?? X ?2 ?7.52?2 C? ?bk 5? 4? 2.82752上式中 b 为区组因素水平数,k 为处理因素水平数。本例区组因素有 5 个水平,处理因素 有 4 个水平。 (2) 计算总的离均差平方和 SS 总: SS总 ? ? X 2 ? C ? 3.52? 0.74128 (3) 计算处理组间离均差平方和 SS 处理:SS处理 ? ??? X i ?2bi?C ??3.09?2 ? ?1.50?2 ? ?1.69?2 ? ?1.24?25 5 5 5? 2.884bi 为各处理组例数。 (4) 计算区组间离差平方和 SS 区组:SS区组 ? ??? X ?j2kj?C ??1.61?42?? 2.02?42??1.14?42??1.32?42??1.43?42? 2.82752 ? 0.11233kj 为各区组例数。 (5) 计算误差的离均差平方和 SS 误差: SS 误差=SS 总-SS 处理-SS 区组=0.784-0.11 (6) 计算自由度:-75- ?总 =总例数-1=20-1=19 ?处理=处理组数-1=4-1=3 ?区组=区组数-1=5-1=4 ?误差=?总-?处理-?区组=19-3-4=12(7) 列出方差分析表:变异来源 总 处理 区组 误差 SS 0.84 0.11 表 6.8 例 6.10 资料两因素方差分析表 MS ? 19 3 0...01818 F 7.53 1.54 P & 0.01 & 0.05表 6.8 中 MS=SS/?,例如, MS 处理=0..13695;F=MS 处理/MS 误差=0.18=7.53 查附表 4 方差分析用 F 界值表,得: F0.05,(3,12)=3.49 F0.05,(4,12)=3.26 F0.01,(3,12)=5.95 F0.01,(4,12)=5.41 显然处理组间均数的检验结果是 F>F0.01,P<0.01,拒绝 H0,接受 H1,差别有统计学意 义,可认为三种药物对小白鼠肉瘤(S180)的抑瘤效果与对照组不同;但区组间差别无统计 学意义,即各窝小白鼠对肉瘤生长的反应相同。 若想进一步了解哪种药物有抑瘤作用(即与对照组抑瘤效果不同) ,则可用 q?检验进 行 3 个实验组和 1 个对照组的比较,具体过程略。§ 6.5 方差齐性检验6.5.1 两个方差的齐性检验 在应用前述两样本均数比较的 t 检验时,理论上要求两相应总体的方差相等,即所谓 方差齐(homogeneity)。即使两总体方差相等,也可能由于抽样误差导致两样本方差不同, 则样本方差不相等是否由于抽样误差所致, 可用方差齐性检验, 即检验 ? 12 ? ? 2 2 的假设是 否成立。因此,若已知两样本方差 s12 和 s 2 2 ,可据此推断各自所代表的总体方差是否相等。 Levene 氏方差齐性检验的检验统计量是方差之比 F,其计算公式为:F ? s12 s 2 2 , ? 1 ? n1 ? 1 , ? 2 ? n2 ? 12 2(6.16)式中 s1 为较大方差, s 2 为较小方差,?1、?2 为相应的自由度,n1、n2 为相应的样本含量。 由于取 s12 & s 2 2 ,所以必然统计量 F&1,算得 F 值后,须查附表 5 方差齐性检验用 F 界值 表,得 P 值,按所取? 水准界定 P 值并作出统计推断。这里,检验水准一般取 0.20。 例 6.11 对例 6.4 资料进行方差齐性检验。-76- H0:两总体方差相等,即 ? 1 2 ? ? 2 2 ; H1:两总体方差不等,即 ? 12 ? ? 2 2 。?=0.20。已知:s1 =14.39,s2 =10.38。则检验统计量: F ? 14.392 10.382 ? 1.9219 按? 1 ? 14 ,? 2 ? 11 ,查附表 5.1,得双侧 F0.20,(15,11)=2.17,F0.20,(12,11)=2.21,用线性插值法近 似估计 F0.20,(14,11)=2.18,F&F0.20,(14,11),P&0.20(确切的 P=0.265) ,故在? =0.20 的水准上, 不拒绝 H0,即可认为两总体方差相等。 6.5.2 多个方差的齐性检验 方差齐性亦是方差分析对原始数据的要求之一。为了比较多个样本均数而作方差分析 前,须进行方差齐性检验,即推断与多个样本所对应的总体方差是否相等,若方差齐,则 可用 F 检验;方差不齐时宜用 F ? 检验或其它方法。Bartlett 检验是方差齐性检验最为常用 的方法。 Bartlett 检验须计算 ?c2 统计量,根据样本含量是否相等, ?c2 的算法略有不同: (1) 当各样本含量相等时,可用式(6.17)和式(6.18)计算:? 2 ? ?n ?1? k ln sc 2 ? ? ln si 2? c2 ? ? 2 ?1 ?? ???(6.17) (6.18)k ? 1 ? ,? ? k ? 1 ? 3k ? n ? 1? ?2 式中 n 为每组样本含量,k 为样本组数, si2 为各组样本的方差, sc 为合并方差,当各组样本含量相等时, sc ?2?s2ik ,?为自由度。(6.19)(2) 当各组样本含量不等时,须先计算合并方差 s c 2 。 2 sc ? ? SSi ?? i , ? i ? ni ? 1 再用下式计算 ? c 2 值。式中 SSi 为各样本的离均差平方和, i 为各组自由度, i 为各组样本含量。 ? n 算得合并方差后,? 2 ? ln sc 2? ? ? ?????n ?1? ? ??n ?1?ln si i2i(6.20) (6.21)?c2 ? ? 2 ?1 ?式中的符号同上。在求得 ?c2 值后,查附表 3,?2 界值表可得到 P 值,按所取的?水准作出 判断。 例 6.12 对例 6.6 资料进行方差齐性检验。 H0:3 个总体方差相等,即 ? 1 2 ? ? 2 2 ? ? 3 2 ; H1:3 个总体方差不全等或全不等。? ?? ? ? k ? 1 1 1 1 ? ? ?? ?? , 3 ? k ? 1? ? ni ? 1 ? ? ni ? 1? ? ? ? ??? = 0.20。已知:n1=20,n2=19,n3=20,s1=0.9133,s2=1.2971,s3=0.7801,则:-77- sc2 ? ? (ni ? 1)si 2 ? 0.8187? (ni? 1) ? ? 0.91332 ? 19 ? 1.01212 ? 18 ? 0.78012 ? 19 ? / 56? 2 ? ? ln sc2 ? ? ? ni ? 1? ? ? ? ni ? 1? ln si 2? 1.2499? ln(0.8187) ? 56 ? ?19 ? ln(0.91332 ) ? 18 ? ln(1.01212 ) ? 19 ? ln(0.78012 ) ??c2 ? 1.2499 ?1 ? ? ? ? ? ?? ? 1.2208 ? 6 ? 19 18 19 56 ?? 按自由度?=k-1=3-1=2 查附表 3,得?20.50,2=1.39, ?c2 ? ? 20.50, ,则 P&0.50(确切的 P 2?1? 1111 ??=0.543) 。故在? =0.20 水准上,不拒绝 H0,可认为该资料方差齐。§ 6.6 方差分析的正确应用(1) 方差分析对原始数据的要求与 t 检验一样,即要求资料满足独立性、正态性和方 差齐性。 (2) 当原始资料不能满足分析方法的要求时,经选用适当的变换,其变换值可达到或 接近其要求。在多数情况下,通过变量变换若达到方差齐性要求的资料,其正态性问题一 般也会有所改善。以下是 3 种常用的变量变换方法。 ① 对数变换(logarithmic transformation) 将原始数据的对数值作为分析数据,其最常 用形式为 y=lgX,也可选用 y=lg(X+k)或 y=lg(k-X),当原始数据有 0 时,可用 lg(X+k)进行数 据变换,其中 k 为一小值。对数变换可用于:服从对数正态分布的资料;部分正偏态资料、 等比资料等,特别是各组的 s 与 X 的比值相差不大(各组 CV 相近)的资料。 ② 平 方 根 变 换 (square root transformation) 样本的方差与均数呈正相关的资料等。 ③ 平方根反正弦变换(arcsine of square root transformation) 将原始资料的平方根反 正弦变换值 y ? sin?1 X 作为分析数据。平方根反正弦函数变换可用于原始数据为(0,1)区 间内的资料,例如,观察不同致畸物质对孕鼠的影响,在分娩后记录每个孕鼠仔代中畸形 的发生率。此时一窝小鼠为一个观察单位,其致畸率为观察值。在分析时可将致畸率用平 方根反正弦函数变换,其变换值一般接近正态性和方差齐性。 (3) 两两比较 从逻辑上讲,只有当方差分析拒绝 H0,认为各组总体均数不等或不 全相等时,才有必要进行两两比较。 两两比较不能用 t 检验,因为此时将人为地增加第一类错误率。 两两比较经常出现 X 1 , X 2 , X 3 这种模糊的检验结果,即样本 1 与样本 2 差异无统计学 意义,样本 2 与样本 3 差异无统计学意义,样本 1 与样本 3 差异有统计学意义。这时说明 本研究结果尚不能分辨样本 2 与另二个样本之间的差异。 以下两种解释都是错误的: “样 ① 本 2 所代表的总体介于总体 1 与总体 3 之间。 ”这实际上承认 3 个样本分别来自 3 个不同-78-将 原 始 资 料 的 平 方 根 y=X 或y ? X ? k 作为分析数据。平方根变换可用于:服从 Poisson 分布的资料、轻度偏态资料、 的总体,即三者之间的差异均有统计学意义;② “既然样本 1 与样本 2 差异无统计学意 义,样本 2 与样本 3 差异无统计学意义,所以样本 1 与样本 3 差异也没有统计学意义。 ” 须知抽样误差是不能递推的,否则将得出荒唐的结论。 有时,方差分析拒绝 H0,但两两比较却找不到有差异的任何两个样本。这是因为方差 分析的检验功效比两两比较的检验功效高。这种现象往往发生于各检验统计量在其界值附 近时,此时下结论应特别谨慎。 (4) F 值、t 值、q 值、q?值之间的关系 在两样本均数比较时, F ? t 。若此时用 q 检验或 q?检验,则亦可得到同样的结论。 这说明在两样本均数比较时,t 检验、F 检验、q 检验及 q?检验是等价的。 当组数 k&2 时,q?检验的检验功效高于 q 检验,因此,当实验研究按一个对照组与多 个实验组均数比较而设计时,用 q?检验可得到较高的功效。-79-

我要回帖

更多关于 均值显著性检验 的文章

 

随机推荐