春夏秋冬季节图片某一季节的发病率与其他季节相比,是否有统计学意义

您所在位置: &
&nbsp&&nbsp&nbsp&&nbsp
幽门螺杆菌感染和年龄、季节、性别的关系.pdf 19页
本文档一共被下载:
次 ,您可全文免费在线阅读后下载本文档。
下载提示
1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
2.该文档所得收入(下载+内容+预览三)归上传者、原创者。
3.登录后可充值,立即自动返金币,充值渠道很便利
需要金币:200 &&
你可能关注的文档:
··········
··········
中文论著摘要…………………………………………………”
英文论著摘要…………………………………………………”
二、英文缩略语……………………………………………………“
—1£·—j一
日U舌…………………………………………………………………………………’
材料与方法……………………………………………………“
结果…………………………………………………………………………………·
讨论…………………………………………………………………………………·
结论…………………………………………………………………………………·
四、本研究创新性的自我评价……………………………………“
五、参考文献…………………………………………………………
综j苤…………………………………………………………………………………·
在学期间科研成绩……………………………………………”
致谢…………………………………………………………………………………·
个人简介………………………………………………………”
·中文论著摘要·
幽门螺杆菌感染与年龄、季节、性别的关系
探讨幽门螺杆菌感染与年龄、季节、性别的关系。
对接受14C一呼气试验检查的7225例病例,分别进行年龄、性别、季节分组,
应用卡方检验,分析和比较幽门螺杆菌感染与年龄、性别、季节的关系。
男性和女性幽门螺杆菌阳性率分别为39.7%和39.5%;&30岁组、30岁~59岁
组及&=60岁组的幽门螺杆菌阳性率分别为24.4%,40.2%,52.8%1春夏秋冬四季
的幽门螺杆菌阳性率分别为28.7%,33.5%,43.2%,56.7%。
幽门螺杆菌感染在男女之间没有显著差异,随年龄的增长,幽门螺杆菌感染
率增高;四季中以冬季幽门螺杆菌感染率最高。
幽门螺杆菌:年龄:性别:季节。
·英文论著摘要·
between infectionand
relationship
age·season·sex
between infection
relationshipHpylori
age.Season.sex.
14C—_breamtestwerestudied
whoreceived
respectivelyby
andcontrastthe
relationship
season.Usingsquare analyse
infectionand
age.season.sex.
正在加载中,请稍后...当前位置: >>
卫生统计学题库(1)
医学统计学第一章一、名词解释:1. 同质与变异 4. 抽样误差 7. 计数资料 2. 5. 8. 总体和样本 概率 等级资料 3. 6. 参数和统计量 计量资料绪论二、是非题:1.用定性的方法得到的资料称作数值变量资料,亦称作计数资料。 ( ) 2.观察某人群的血型,以人为观察单位,结果分为 A 型、B 型、AB 型和 O 型,是有序 分类资料。 ( ) 3. 分类变量或称定量变量, 其变量值是定量的, 表现为数值大小, 一般有度量衡单位, 亦称计量资料。 ( ) 4.调查某地 10 岁女孩的身体发育状况,以人为观察单位,测得每个人的身高(cm) 、 体重(kg) 、血 压(mmHg) ,此资料称为多项分类变量资料。 ( ) 5.用定量的方法测定观察单位某个量的大小的资料,称数值变量资料。 ( ) 7.等级分组资料兼有计数与计量资料的性质。 ( ) 8.将观察单位按某一属性的不同程度分组计数,所得各组的观察单位称为计数资 料。 ( )三、单选题:1. 计量资料p计数资料和等级分组资料的关系有 C A.计量资料兼有计数资料和等级分组资料的一些性质 B.计数资料兼有计量资料和等级分组资料的一些性质 C.等级分组资料兼有计量资料和计数资料的一些性质 D.计数资料有计量资料的一些性质 E.等级分组资料又可叫半计数资料 2. 为了由样本推断总体,样本应该是 E A.总体中任意一部分 B.总体中的典型部分 C 总体中有意义的一部分 D.总体中有价值的一部分 E.总体中有代表性的一部分 3. 统计学上所说的系统误差p测量误差和抽样误差三种误差,在实际工作中有 D A.三种误差都不可避免 B.系统误差和测量误差不可避免 C.系统误差和抽样误差不可避免 D.测量误差和抽样误差不可避免 E.三种误差都可避免 4. 抽样误差指的是 C A.个体值和总体参数值之差 B.个体值和样本统计量值之差 C.样本统计量值和总体参数值之差 D. 总体参数值和总体参数值之差 5. 医学统计工作的基本步骤是 D A.调查资料p校对资料p整理资料 B.调查资料p归纳资料p整理资料 C.收集资料p校对资料p整理资料 D.收集资料p整理资料p分析资料 E.收集资料p校对资料p归纳资料1 6. 统计学中所说的总体是指 B A.任意想象的研究对象的全体 C.根据地区划分的研究对象的全体 E.根据人群划分的研究对象的全体B.根据研究目的确定的研究对象的全体 D.根据时间划分的研究对象的全体答案名词解释: (1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基 础上各观察单位(或个体)之间的差异。 (2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本 是从总体中随机抽取的部分观察单位。 (3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称 为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。 (4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误 差。 (5) 概率:是描述随机事件发生的可能性大小的数值,用 p 表示 (6) 计量资料:由一群个体的变量值构成的资料称为计量资料。 (7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称 为计数资料。 。 (8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为 等级资料。 是非题: 1. × 2. × 3. × 4. × 5. √ 6. √ 7. × 单选题: 1. C 2. E3. D4. C5. D6. B第二章一、 名词解释:平均数 标准正态分布计量资料统计描述及正态分布标准差 参考值范围二、 填空题:1、 医学统计资料按研究指标的性质分为________、________和_________三类。 2、 统计工作的全过程按顺序可分为四个步骤,即_________、_________、________和 __________。 3、 正态分布用 N(μ , ? 2)表示,为了应用方便,常对变量 X 作___________变换, 使μ =0 , ? =1,则正态分布转变为___________分布,用___________表示。 4、 正 态 曲 线 下 面 积 的 分 布 有 一 定 规 律 , 理 论 上 ___________ 、 ___________ 和 ___________, 区间的面积 (观察单位数) 各占总面积 (总观察单位数) 的___________、 ___________和___________可用于估计医学参考值范围和质量控制方面。2 5、 标准正态曲线下,区间(-1.96,0)的面积占总面积的___________%。 6、 用___________和___________可全面描述正态分布资料的特征。 7、 为了说明离散程度应选用变异指标, 常用的变异指标有___________、 ___________、 ___________和___________。 8、 ___________范围内的面积占正态曲线下总面积的 95%。 9、 样本值中最大值与最小值之差,称为这个样本的___________记___________。 10、 通常把α 称为___________或___________而将 u>u 1- (α /2) 的区域称作拒绝域, α 一般取___________有时___________或___________。 11、 正常值范围的意义是指绝大多数正常人的变量均在此范围中, 这个绝大多数习惯上 包括正常人的_______、_______、_______、_______而最常用的是_______。 12、 对于正态分布的资料,在μ ±1.96 ? ,μ ±2.58 ? 区间内的变量值,其出现的概率 分别为___________和___________。 13、 频数分布的两个重要特征是指___________和___________, 可全面地分析所研究的 事物。 14、 偏态分布资料宜计算___________以表示其平均水平。 15、 平均数的计算和应用必须具备___________、 ___________,否则平均数是没有意 义。 16、 正态分布有以下的特征 ① 正态曲线在横轴上方, 且_________所处在最高。 ② 正 态 分 布以 _________ 为中 心 左右 对 称。 ③ 正 态 分布 有 两个 参数即 _________ 和 _________。④ 正态分布的面积有一定的__________。 17. 描述一组正态分布资料的变异度,以__________指标为好。 18. 变异系数 CV 常用于比较_________或_________的两组或多组资料的变异程度三、 是非题:1.平均数是一类用于推断数值变量及资料平均水平(或集中趋势)的指标。 ( ) 2.反映频数分布的两个重要特征是集中趋势与散离趋势 。 ( ) 3.标准差是最常用的变异指标,它既可以用于正态资料亦可用于非正态资料。 ( ) 4.计算中位数时要求组距相等。 ( ) 5. 计量单位相同, 均数相差不大时, 可使用变异系数反应两组变量值的离散程度。 ( ) 6.变量值之间呈倍数或等比关系的数据,宜用几何均数表示其平均水平。 ( ) 7.百分位数应用中提到,分布中部的百分位数相当稳定具有较好的代表性,但靠近两 端的百分位数只在样本例数足够多时才比较稳定。 ( ) 8.为了解数值变量分布规律,可将观察值编制频数表,绘制频数分布图,用于描述资 料的分布特征以及分布类型。 ( ) 9.如果少数几个数据比大部分数据大几百倍一般就不宜计算均数 ( ) 10.原始数据有零,就不能直接计算几何均数 ( ) 11.正态分布是以均数为中心的钟型分布 ( ) 12.高峰位于中央,两侧逐渐下降并完全对称的频数分布即为正态分布 ( ) 13.理论上,对于正态分布资料的 P5-P95 和 X ±1.96S 范围内都包含有 95%的变量值。 ( ) 14.制定正常值范围应选足够数量正常人作为调查对象,所谓正常人就是排影响被研 究指标的各种疾病的人 ( ) 15.描述频数分布离散程度的最常用的指标是变异系数和标准差 ( )3 16.正态分布用 N(0,1)表示,为了应用方便,常对变量 X 作 u=(x-?)/ ? 变换, 使μ =0 ? =1 则将正态分布转换为标准正态分布用 N(μ , ? 2)表示 ( ) 17.只要单位相同,用标准差和用变异系数来比较两组变量值的离散度结论是完 全一致的 ( ) 18.四分位数间距 Q=P75~P25,常用于描述近似正态分布资料的离散程度 ( ) 19.频数表和频数分布图用以推断变量值的分布特征和揭示变量值的分布规律 ( ) 20.制定正常值范围,如取 95%界限,是指 95%的正常人本项指标在此范围 ( ) 21.指标无论过高或过低均属异常,可用 X ? us 来计算正常值范围 ( )四、 单选题:1.以年龄(岁)为例,最常用的组段表示法是 B A. 0─5, 5─10,10─15, 15─20??; B.0─ , 5─ ,10─ , 15─ ??; C.0─4, 5─9, 10─14, 15─19??; D. ─5, ─10, ─15, ─20??; E.以上都不是; 2.以下指标中____可用来描述计量资料离散程度。D A.算术平均数 B.几何均数 C.中位数 D.标准差 E.第 50 百分位数 3.偏态分布资料宜用___描述其分布的集中趋势。C A.算术平均数 B.标准差 C.中位数 D.四分位数间距 E.方差 4.用均数和标准差可全面描述___资料的分布特征。A A.正态分布 B.正偏态分布 C.负偏态分布 D.对称分布 E.任何计量资料分布 5.____可用于比较身高与体重的变异度 C A.方差 B.标准差 C.变异系数 D.全距 E.四分位数间距 D 6.各观察值均加(或减)同一个数后,_______。E 举例算一下 A. 均数不变,标准差不一定变 B. 均数不变,标准差变 C. 均数不变,标准差也不变 D. 均数变,标准差不变 E. 均数变,标准差也变 7.各观察值同乘以一个不等于 0 的常数后,______不变 E。 A. 均数 B. 标准差 C. 几何均数 D. 中位数 E. 变异系数 A 8.____的资料,均数等于中位数。C 看错选项?? A. 对称 B. 正偏态 C. 负偏态 D. 对数正态 C 9.最小组段无下限或最大组段无上限的频数分布表资料,可用描述其集中趋势。D A.均数 B.标准差 C.中位数4 D.四分位数间距 E.几何均数 10.描述一组偏态分布资料的变异度,以___ D___指标较好. A. 全距(R) B. 标准差(s) C. 变异系数(CV) D. 四分位数间距 (Qu-QL) 11.计算某抗体滴度的平均水平,一般选择 B A.算术均数 B.几何均数 C.中位数 D.标准差 E.标准误 12.计算某病的平均潜伏期,一般选择 B(观察值不能为 0,同时有正负) C A.算术均数 B.几何均数 C.中位数 D.标准差 E.变异系数 C 13.表示正态分布资料个体变量值的变异程度的常用指标是 C E A.均数 B.全距 C.标准差 D.标准误 E.变异系数(多组间单位不同或均数相差较大) 14.平均数是表示 C A.性质相同的变量值的相对水平 B.性质相同的变量值的实际水平 C.性质相同的变量值的平均水平 D.性质不同的变量值的平均水平 E.性质相同的变量值的变异程度 15.用变异系数比较变异程度,适于 A A 两组观察值单位不同,或两均数相差较大 B 两组观察值单位相同,标准误相差较大 C 两均数相差较大,标准误相差较大 D 以上都不是 16.正偏态资料计算平均水平,首选 C A.算术均数 B.几何均数 C.中位数 D.加权均数 E.百分位数 E 17.均数与标准差的关系是 A E 均数标准误的大小与原变量的标准差成正比 A.均数越大,标准差越大 B.均数越大,标准差越小 C.标准差越大, 均数代表性越好 D.标准差越小, 均数代表性越差 E.标准差越小, 均数代表性越好(只是均数和标准误的关系! ! ) 18.有 8 名某传染病患者,潜伏期分别为:2,1,21,7,12,1,4,13 天。其平均潜 伏期为 C 天。 A.4 B.5.5 C.7 D. 12 E.9.5 19.五小鼠出生体重分别为 4,5,6,7,8(g) ;染毒后存活日数分别为 2,5,6,7, 1 (天) , 问以何种指标比较两组数据变异大小为宜 D (多组间单位不同或均数相差较大) A.S B.S x C.全距 D.CV E.自由度 C 20.调查 50 例链球菌咽峡炎患者潜伏期如下, 为计算均数平均数,应首选 A 潜伏期 12― 24― 36― 48― 60― 72― 84― 96― 108―120 合计 病例数 1 7 11 11 7 5 4 2 2 50 A. 算术均数 B. 几何均数 C. 中位数 D. 百分位数 E. 以上均可以 21. 102 名健康人钩端螺旋体血液抗体滴度分布如下,欲表示其平均水平,宜用 抗体滴度 1s100 1s200 1s400 1s800 1s1600 合 计B5 人数719342913102A. 算术均数 B. 几何均数 C. 中位数 D. 百分位数 E. 以上均可以 22.对于均数μ p标准差为σ 的正态分布,95%的变量值分布范围为 B A.μ -σ ~μ +σ B.μ -1.96σ ~μ +1.96σ C.0~μ +1.96σ D.-∞~μ +1.96σ E.μ -2.58σ ~μ +2.58σ E 23.若 u 服从均数为 0,标准差为 1 的正态分布,则 A A.u≥2.58 的 P=0.01 B.u≥2.58 的 P=0.005 C.-2.58<u<2.58 的 P=0.01 D.u≥2.58 的 P=0.05 E. u≥2.58 的 P=0.025(双侧) 24.正态分布有两个参数μ 与σ ,__C____曲线的形状越扁平。 A. μ 越大 B. μ 越小 C. σ 越大 D. σ 越小 E. μ 与 σ 越接近 0 A 25.对数正态分布是一种__B___分布 A. 正态 B. 近似正态 C. 左偏态 D. 右偏态 E. 对称 26.正态分布曲线下,横轴上,从均数μ 到+∞的面积占总面积的比例为_C_____ A.97.5% B.95% C.50% D.5% E.不能确定(与标准差的大小有关) 27.标准正态分布的均数与标准差分别为__B___ A. 0 与 1 B. 1 与 0 C. 0 与 0 D. 1 与 1 E. 1.96 与 2.58 D 28.若 X 服从以 μ ,σ ?为均数和方差的正态分布,则 X 的第 95 百分位数即_E__ A. μ -1.64σ B. μ -1.96σ C. μ +σ D. μ +1.64σ E. μ +1.96σ D 29.若正常成人的血铅含量 X 服从近似对数正态分布,则可用公式____E__制定 95% 正常 值范围。(其中:Y=logX) A. < X +1.96S B. < X +1.64S C. < Y +1.64SY -1 -1 D. <log ( Y +1.64SY) E. <log ( Y +1.96SY) D 30.正态分布曲线下,横轴上,从均数μ 到μ +1.96 倍标准差的面积为__A__ A.95% B.45% C.97.5% D.47.5%(50%-2.5%)画图 A 31.标准正态分布曲线下中间 90%的面积所对应的横轴尺度 u 的范围是 D (画图) A. C1.645 到+1.645 B. -∞到+1.645 C. ∞到+1.282 D. C1.282 到+1.282 x?? 32.设 X 符合均数为μ p标准差为σ 的正态分布,作 u= 的变量变换则 E ? A.符合正态分布,且均数不变 B.符合正态分布,且标准差不变 C.u 符合正态分布,且均数和标准差都不变 D.u 不符合正态分布 E.u 符合正态分布,但均数和标准差都改变6 33.正态分布是以 D A.标准差为中心的频数分布 B.t 值为中心的频数分布 C.组距为中心的频数分布 D.均数为中心的频数分布 E.观察例数为中心的频数分布 34.用变异系数比较变异程度,适于 A A 两组观察值单位不同,或两均数相差较大 B 两组观察值单位相同,标准误相差较大 C 两均数相差较大,标准误相差较大 D 以上都不是 D 35.决定个体值正态分布的参数是 C A.变异系数 B.全距 C.标准误 D.标准差 E.以上都不是 36.正态分布是以 D A.标准差为中心的频数分布 B.t 值为中心的频数分布 C.组距为中心的频数分布 D.均数为中心的频数分布 E.观察例数为中心的频数分布 37.正偏态资料计算平均水平,首选 C A.算术均数 B.几何均数 C.中位数 D.加权均数 E.百分位数 38.均数与标准差的关系是 E A.均数越大,标准差越大 B.均数越大,标准差越小 C.标准差越大,均数代表性越好 D.标准差越小,均数代表性越差 E.标准差越小,均数代表性越好 D? 39.计量资料的标准差 A.不会比均数大 B.不会比均数小 C.要比标准误小 D.不决定于均数 E.以上都不对 B 40.有 9 名某传染病人,潜伏期分别为(天) :2,1,21,7,12,1,4,13,24 其平均潜伏期为 C (几何均数) A.4 B.5.5 C.7 D. 12 E.9.5 41.表示变异程度的指标中 C A.标准差越大,变异程度越小 B.标准差越小,变异程度越大 C.变异系数越大,变异程度越大 D.变异系数越大,变异程度越小 E.全距越大,变异程度越小 42.正态资料的变异系数应 B A.一定>1 B.一定<1 C.可能>1,也可能<1 D.一定<标准差 E.一定>标准差 D 43.五小鼠出生体重分别为 4,5,6,7,8(g) ;染毒后存活日数分别为 2,5,6, 7,1(天) ,问以何种方式说明两组数据变异大小 B A.S B.S x C.全距 D.CV E.自由度 C 44.调查 50 例链球菌咽峡炎患者潜伏期如下 潜伏期 病例数 12―24―36―48―60―72―84―96―108―120 1 7 11 11 7 5 4 2 2 B 合计 50求平均潜伏期,应首选7(常用的平均数有三种:算数均数、几何均数、中位数) A.算术均数(患者例数较多) B.几何均数(不属于对数正态分布) C. 中位数(方便快捷) D. 百分位数 E. 以上均可以 45.102 名健康人钩端螺旋体血液抗体滴度分布如下,欲表示其平均水平,宜用 B ───────────────────────────────────── 抗体滴度 1s100 1s200 1s400 1s800 1s1600 合 计 人数 7 19 34 29 13 102 A. 算术均数 B. 几何均数 C. 中位数 D. 百分位数 E. 以上均可以五、 问答题:1.均数p几何均数和中位数的适用范围有何异同? 2.中位数与百分位数在意义上p计算和应用上有何区别与联系? 3.同一资料的标准差是否一定小于均数? 4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些? 5.正态分布p标准正态分布与对数正态分布在概念上和应用上有何异同? 6.医学中参考值范围的含义是什么?确定的原则和方法是什么? 7.对称分布资料在“均数±1.96 倍标准差”的范围内,也包括 95%的观察值吗? 六、 计算题 1. 某地 101 例 30~49 岁健康男子血清总胆固醇值(mmol/L)测定结果如下: 4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 5.39 6.30 5.21 7.22 5.54 3.93 5.21 6.51 5.18 5.77 4.79 5.20 5.10 4.70 4.07 3.50 4.69 4.38 4.89 6.25 5.32 4.50 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 3.18 3.97 5.16 5.10 5.86 4.79 5.34 4.24 4.32 4.77 6.36 4.86 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.04 3.91 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 5.18 6.14 3.24 4.90 3.05 (1)编制频数分布表并绘制直方图,简述其分布特征。 (2)计算均数 X 、标准 s、变异系数 CV。 (3)计算中位数 M,并与均数 X 比较, (4)计算 P2.5 及 P97.5 并与 X ±1.96s 的范围比较。 (5)分别考察 X ? 1S、 X ? 1.9S6、 X ? 2.58S 范围内的实际频数与理论 分布是否基本一致? (6)现测得一 40 岁男子的血清总胆固醇值为 6.993(mmol/L) ,若按 95% 正常值范围估计, 其血清总胆固醇值是否正常?估计该地 30~49 岁 健康男子中,还有百分之几的人血清总胆固醇值比他高? 2. 某地卫生防疫站,对 30 名麻疹易感儿童经气溶胶免疫一个月后,测得其得血凝抑 制抗体滴度资料如表。 4.37 5.12 4.63 4.97 6.38 4.38 2.70 4.348 表 2-1: 抗体滴度 1:8 1:16 1:32 1:64 1:128平均滴度计算表 人数 f 2 6 5 10 41:256 2 1:512 1 合计 30 (1) 试计算其平均滴度。 (2) 有人发现本例用抗体滴度稀释倍数和直接用滴度倒数算得几何标准差的对数 值相同,为什么?3.50 例链球菌咽峡炎患者的潜伏期如表,说明用均数、中位数或几何均数,何者 的代表性较好?并作计算。 表 2-2: 潜伏期(小时) 12~ 24~ 36~ 48~ 60~ 72~ 84~ 96~ 108~120 合计 50 例链球菌 咽峡炎患者的潜伏期病例数 f 1 7 11 11 7 5 4 2 2 509 4.某市 1974 年为了解该地居民发汞的基础水平,为汞污染的环境监测积累资料,调查 了留住该市一年以上,无明显肝、肾疾病,无汞作业接触史的居民 238 人,发汞含 量如表: 表 2-3:238 人发汞含量频数计算表 发汞值 人数 f (μ mol/kg) 1.5~ 20 3.5~ 66 5.5~ 60 7.5~ 48 9.5~ 18 11.5~ 16 13.5~ 6 15.5~ 1 17.5~ 0 19.5~21.5 3 合计 238 (1).说明此频数分布的特征, (2). 计算均数和中位数,何者较大?为什么?何者用于说明本资料的集中位置较合 适? (3). 选用何种指标描述其离散程度较好? (4). 估计该地居民发汞值的 95%参考值范围答案名词解释: 1. 平均数 2. 标准差 3. 标准正态分布 4. 参考值范围 是描述数据分布集中趋势(中心位置)和平均水平的指标 是描述数据分布离散程度(或变量变化的变异程度)的指标 以μ 服从均数为 0、标准差为 1 的正态分布,这种正态分布 称为标准状态分布。 参考值范围也称正常值范围,医学上常把把绝大多数的某指 标范围称为指标的正常值范围。填空题: 1. 计量,计数,等级 2. 设计,收集资料,分析资料,整理资料。 3. u ?4. ? ? 5. 47.5%? ?? (变量变换)标准正态分布、0、1 ?? 1.96? ? 2.58?68.27% 95% 99%6.均数、标准差 7. 全距、方差、标准差、变异系数 ? ? 2.58? 8. ? ? 1.96? 9. 全距 R 10. 检验水准、显著性水准、0.05、100.01(0.1) 11. 80% 90% 95% 99% 95% 12. 95% 99% 13. 集中趋势、离散趋势 14. 中位数 15. 同质基础,合理分组 16. 均数,均数,μ ,σ ,规律性 17. 标准差 18. 单位不同,均数相差较大 是非题: 1. × 2. √ 3. × 4. × 5. × 6. √ 7. √ 8. √ 9. √ 10. √ 11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √ 21. √ 单选题: 1. B 2. D 11. B 12. C 21. B 22. B 31. A 32. E 41. C 42. B3. C 13. C 23. E 33. D 43. D4. A 14. C 24. C 34. A 44. C5. C 15. A 25. A 35. D 45. B6. D 16. C 26. C 36. D7. E 17. E 27. B 37. C8. A 18. C 28. D 38. E9. C 19. D 29. D 39. D10. D 20. C 30. D 40. B问答题: 1.均数p几何均数和中位数的适用范围有何异同? 答:相同点,均表示计量资料集中趋势的指标。 不同点:表 2-5. 表 2-5 均数,几何均数和中位数的相异点 平 均 数 意 义 应用场合 均 数 平均数量水平 应用甚广,最适用于对称分布,特别是正态分布 几何均数 平均增减倍数 ①等比资料;②对数正态分布资料 中位数 位次居中的观 ①偏态资料;②分布不明资料;③分布一端或两 察值水平 端出现不确定值 2.中位数与百分位数在意义上p计算和应用上有何区别与联系? 答: 1)意义: 中位数是百分位中的第 50 分位数, 常用于描述偏态分布资料的集中位置, 反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某 百分位置的水平,最常用的百分位是 P50 即中位数。多个百分位数结合使用,可 更全面地描述总体或样本的分布特征。 (2)计算:中位数和百分位数均可用同一公式计算,即 Px=L+(i/fx) (n?x%-Σ fL) 可根据研究目的选择不同的百分位数代入公式进行计算分析。 (3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考 值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中 更为常用。百分位数还可以用来描述变量值的离散趋势(四分位数间距) 。 3.同一资料的标准差是否一定小于均数? 答:不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。 变异大,标准差就大,有时比均数大;变异小,标准差小。11 4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些? (1)样本含量的大小,样本含量越大,标准差越稳定。 (2)分组的多少 (3)分布形状的影响,偏态分布的标准差较近似正态分布大 (4)随机测量误差大小的影响 (5)研究总体中观察值之间变异程度大小 5.正态分布p标准正态分布与对数正态分布在概念上和应用上有何异同? (1) 概念上:①相同点:正态分布、标准正态分布与对数正态分布都是变量的 连续型分布。其特征是:分布曲线在横轴上方,略呈钟型,以均数为中心,两边 对称,均数处最高,两边逐渐减小,向外延伸,不与横轴相交。②相异点:表示 方法不同,正态分布用 N(?,σ 2)表示,标准正态分布用 N(0,1)表示,对数 正态分布 N(μ lgX,σ 2lgX)表示。 (2) 应用上:①相同点:正态分布、对数正态分布都可以转换为标准正态分布。 ②相异点:标准正态分布是标准正态变量 u 的分布,标准正态曲线下的面积唯一 的由 u 决定,给应用带来极大方便。对医学资料呈偏态分布的数据,有的经对数 变换后服从正态分布。正态分布、对数正态分布可描述变量值的分布特征,可用 于正常值范围估计和质量控制等。正态分布是很多统计方法的理论基础。 6.医学中参考值范围的含义是什么?确定的原则和方法是什么? 含义:参考值范围亦称正常值范围,它是指特定健康状况人群(排除了有关 疾病和因素对所研究指标有影响的所谓“正常人”不同于“健康人”概念)的解 剖、生理、生化等数据绝大多数人的波动范围。 (2)原则: ① 抽取有代表性的足够例数的正常人群样本,样本分布越接近总体,所得结 果越可靠。 一般认为样本含量最好在 100 例以上, 以能得到一个分布较为 稳定的样本为原则。 ② 对选定的正常人进行准确而统一的测定,保证测定数据可靠是确定正常值 范围的前提。 ③ 判定是否要分组(如男女、年龄、地区等) 确定正常值范围。 ④ 决定取双侧范围值还是单侧范围值。 ⑤ 选择适当的百分范围 ⑥ 确定可疑范围 ⑦ 估计界值 (3)方法: ① 百分位数法:Px=L+(i/fx) (n?x%-Σ fL) ② 正态分布法(对数正态分布) : 双侧X ? u?S lg?1 X lg X ? u ? S lg X??百分位数法用于各种分布型(或分布不明)资料;正态分布法用于服从或近 似正态分布(服从对数正态分布)的资料。 7.对称分布资料在“均数±1.96 倍标准差”的范围内,也包括 95%的观察值吗? 答:不一定。均数±1.96 倍标准差是正态分布的分布规律,对称分布不一定是正 态分布。12 计算题:1. 某地 101 例 30~49 岁健康男子血清总胆固醇值(mmol/L)测定结果如下: 4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 5.18 5.77 4.79 5.12 5.20 5.10 4.70
4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 5.16 5.10 5.86 4.79 5.34 4.24 4.32 4.77 6.36 4.86 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.47 3.04 3.91 2.70 4.60 4.09 5.96 5.48 4.40 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 3.05 (1)编制频数分布表,简述其分布特征。 ① 找出最大值、最小值求全距(R) : 全距=最大值-最小值=7.22-2.70=4.50(mmol/L) ② 求组距:I=全距/组数=4.52/10=0.452≈0.5(mmol/L) ③ 分组段,划记(表 1-1)4.12 6.51 4.69 4.25 3.97 6.38 5.09 4.03 4.55 4.90表 2-6某地 101 例 30~49 岁健康男子血清总胆固醇值划记表 划记 频数 1 8 9 23 25 17 9 6 2 1 101组段(mmol/L) 2.5~ 3.0~ 3.5~ 4.0~ 4.5~ 5.0~ 5.5~ 6.0~ 6.5~ 7.0~7.5 合计由表 2-6 可知,本例频数分布中间局多,两侧逐渐减少,左右基本对称。13 表 2-7 血清总胆 固醇值 2.5~ 3.0~ 3.5~ 4.0~ 4.5~ 5.0~ 5.5~ 6.0~ 6.5~ 7.0~7.5某地 101 例 30~49 岁健康男子血清总胆固醇值(mmol/L) X 、s 计算表 组中值 X 2.75 3.25 3.75 4.25 4.75 5.25 5.75 6.25 6.75 7.25 频数 f 1 8 9 23 25 17 9 6 2 1 fX 2.75 26.00 33.75 97.75 118.75 89.25 51.75 37.50 13.50 7.25 478.25 fX2累计 频数累计频数 (实际) 0.1 0.9 0.8 0.3 0.07.563 1 84.500 9 126.563 18 415.438 41 564.063 66 468.563 83 297.563 92 234.375 98 91.125 100 52.563 101 注:Xu 为组段上限值(2)计算均数 X 、标准 s、变异系数 CV。 由上计算表 1-2 可见: X ? ?fX / ?f ? 478.25/101=4.735(mmol/L)s??fX 2 ? (?fX) 2 / ?f ?f ? 1?? (478.25) 2 / 101 101? 1=0.882(mmol/L)CV= s / x ? 100%=0.882/4.735 ? 100%=18.627% (3)计算中位数 M,并与均数 X 比较,利用前表计算中位数 M M = L+(i/f50) (n ? 50%-Σ fL) =4.5+(0.5/25) (101 ? 50%-41)=4.69(mmol/L) 本题算术均数为 4.735(mmol/L) ,与中位数 4.69(mmol/L)很接近,这也是 资料服从正态分布的特征之一。 (4)计算 P2.5 及 P97.5 并与 X ±1.96s 的范围比较。 P2。5=3.0+(0.5/8) ? (101 ? 2.5%-1)=3.095(mmol/L) P97.5=6.5+(0.5/2) ? (101 ? 97.5%-98)=6.619(mmol/L)14 X ? 1.96S=4.735±1.96 ? 0.882=3.01~6.46(mmol/L)用百分位数法求得 101 例 30 ~ 49 岁健康男子血清总胆固醇值 95% 分布范围 3.095 ~ 6.619 ( mmol/L ) ,与正态分布法求得的 95% 分布范围 3.01 ~ 6.46 (mmol/L)基本一致。 (5)分别考察 X ? 1S、 X ? 1.96S、 X ? 2.58S 范围内的实际频数与理论分布是否基 本一致(表 1-3)表 2-8 某地 101 例 30~49 岁健康男子血清总胆固醇值理论分布与实际分布比较 血清总胆固醇 实际分布 人数 % 71.29 96.04 99.01 理论分布 % 68.27 95.00 99.00X ? usX ? 1s X ? 1.96s X ? 2.58s3.85~5.62 3.01~6.46 2.46~7.0172 97 100由上表 , X ? 1s 范围内 , 实际分布与理论分布略有不同 , 而 X ? 1.96s 、X ? 2.58s 范围内,实际分布与理论分布基本一致。(6)现测得一 40 岁男子的血清总胆固醇值为 6.993(mmol/L) ,若按 95%正常值 范围估计,其血清总胆固醇值是否正常?估计该地 30~49 岁健康男子中, 还有百分之几的人血清总胆固醇值比他高? 前计算得 95%正常值为 3.01~6.46(mmol/L)现测得一 40 岁男子的血清总 胆固醇值为 6.993(mmol/L) ,在 95%范围以外,故属于异常 u=(X-μ )/σ =(6.993-4.735)/0.882=2.56 因 ф (2.56)=ф (-2.56) ,查表 1 得 ф (-2.56)=0.0052 估计该地 30~49 健康男子中约有 0.52%的人血清总胆固醇值比他高。 2.某地卫生防疫站,对 30 名麻疹易感儿童经气溶胶免疫一个月后,测得其得血凝抑 制抗体滴度资料如表 2-9 第(1) (2)栏。 表 2-9 平均滴度计算表抗体滴度 (1) 1:8 1:16 1:32 1:64 1:128 1:256 1:512 合计 人数 f (2) 2 6 5 10 4 2 1 30 滴度倒数 X1 (3) 8 16 32 64 128 256 512 lgX1 flgX1 (4) (5)=(2)×(4) 0.1 1.2 2.2 2.2 7.7 18.8 4.3 50.573015 (1) 试计算其平均滴度。 由表 1-4 得,G=lg-1(50.5730/30)=lg-11. 该站 30 名麻疹易感儿童经气溶胶免疫一个月后,测得血凝抑制抗体平均滴度为 1:48.50表 2-10 平均滴度计算表 抗体滴度 人数 f 滴度倒数 X1 lgX1 flgX1 (1) (2) (3) (4) (5) = (2) ? (4) 1s8 2 8 0.2 1s16 6 16 1.7 1s32 5 32 1.7 1s64 10 64 1.8 1s128 4 128 2.8 1s256 2 256 2.5 1s512 1 512 2.3 合计 30 50.5730 (2) 有人发现本例用抗体滴度稀释倍数和直接用滴度(原书误为倒数)算得对 数值的标准差相同,为什么? 表 2-11 滴度对数值计算表 抗体滴度 X2 人数 f lgX2 flgX2 1s8 2 -0.2 1s16 6 -1.7 1s32 5 -1.7 1s64 10 -1.8 1s128 4 -2.8 1s256 2 -2.5 1s512 1 -2.3 合计 30 -50.)由表 1-4 中数据计算标准差为:slgx1=lg 0.3 2) 由表 1-5 中数据计算标准差为:slgx2=lg-10.3 直接用抗体滴度的对数 lgx2 与稀释倍数的对数 lgx1 计算标准差是相等的,因 为由上表可见 lgx2=lg1-lgX1=-lgx1,而 lgx1 与-lgx1 的离散程度是相同的,所以用 抗体滴度稀释倍数和直接用滴度算得对数值的标准差是相同的。 3. 50 例链球菌咽峡炎患者的潜伏期如表 2-12,说明用均数、中位数或几何均数, 何者的代表性较好?并作计算。 表 2-12 50 例链球菌咽峡炎患者的潜伏期的中位数计算表 潜伏期(小时) 12~ 24~ 36~ 48~ 60~16病例数 f 1 7 11 11 7累计频数 1 8 19 30 72~ 5 84~ 4 96~ 2 108~120 2 合计 50 本例目测频数分布为偏态分布,长尾拖向右侧,故为正偏态,宜用中位数及几 何均数表示其平均水平。 如上表,经计算中位数,几何均数、算术均数分别为: M=54.55(小时) ,G=54.08(小时) , X =58.56(小时)显然,算术均数受长潜 伏期的影响使其偏大,中位数 M 与几何均数 G 接近,故描述链球菌咽峡炎患者潜伏 期的集中趋势指标使用中位数 M 或几何均数 G 均可。 4.某市 1974 年为了解该地居民发汞的基础水平,为汞污染的环境监测积累资料,调查 了留住该市一年以上,无明显肝、肾疾病,无汞作业接触史的居民 238 人,发汞含量 如表 2-13: 表 2-13 238 人发汞含量频数计算表发汞值 (μ mol/kg) 1.5~ 3.5~ 5.5~ 7.5~ 9.5~ 11.5~ 13.5~ 15.5~ 17.5~ 19.5~21.5 合计 人数 f 20 66 60 48 18 16 6 1 0 3 组中值 X 2.5 4.5 6.5 8.5 10.5 12.5 14.5 16.5 18.5 20.5 fX fX? 125.00 5.00 4.50 1.50 272.25 0.00 43.50 累计频数 20 86 146 194 212 228 234 235 235 238 累计频率 8.40 36.10 61.34 81.50 89.08 95.80 98.32 98.74 98.74 100.0050.0 297.0 390.0 408.0 189.0 200.0 87.0 16.5 0.0 61.5 1699.0238(1).说明此频数分布的特征:可见发汞值的频数分布高峰位于第 2 个组段。前 4 个组段的频数占总频数的 81.5%,长尾拖向右侧,呈极度正偏态。 (2). 计算均数 和中位数 M,何者较大?为什么?何者用语说明本资料的集中 位置较合适?X ? ?fX / ?f =.139(μ mol/kg)M =L+(i/f50) (n ? 50%-Σ fL) =5.5+2/60(238 ? 50%-86)=6.6(μ mol/kg) 由计算结果得知, X ? M 其原因因为本例呈正态分布,均数计算结果受到少 数较大发汞值的影响,使得 X 偏向大发汞值一边.本例用中位数描述偏态资 料的集中趋势较好,它不受两端较大值和极小值的影响. (3). 选用何种指标描述其离散程度较好?17 选用四分位数间距描述其离散程度较好. (4). 估计该地居民发汞值的 95%参考值范围 本资料应选用单侧 95%上界值,本例是正偏态分布.而且样本含量较大, n=238,保证获得一个较为稳定的分布,故采用百分位数法计算的参考值范 围较为合适. P95=L+(i/f95)(n ? 95%-Σ fL) =11.5+(2/16)(238 ? 95%-212)=13.2625(μ mol/kg)第三章一、 名词解释:1. 标准误 4. 检验水准 7. 第 I 类错误均数的抽样误差与 t 检验2. 总体均数可信区间 5. 检验统计量 8. 第 II 类错误3. 假设检验 6. P 值二、 填空题:1.用样本均数估计总体均数的可靠程度宜选用__________。 2. 一般将概率小于_________和_________的随机事件称为小概率事件。 3. 对 总 体 所 作 的 假 设 进 行 统 计 推 断 , 作 出 拒 绝 或 接 受 假 设 的 结 论 的 方 法 , 称 ___________。 4.样本均数比较,经 t 检验差别有显著性时,P 越小,说明___________。 5.t 分布的图型形状与___________有关。 6.可信区间的两个要素是___________,______ 。 7.准误愈小,表示_________愈小,_________对_________估计愈可靠。 8.统计推断包括___________和___________两方面。 9.设检验中,不拒绝 Ho 时,可发生_________错误,其概率用_________表示。三、 是非题:1.区间估计以预先给定的概率(可信度)估计总体参数在哪个范围内的方法,称区间 估计。 ( ) 2.样本标准误 S X ? S 反映了抽样误差大小,显然 n 越大抽样误差越大,用样本推 n 断总体的精度越高 。 ( ) 3.抽样误差的大小可以用标准差来表示 。 ( ) 4.参数估计有⑴点(值)估计――用样本统计量值估计相应的总体参数。⑵区间估计 ――估计总体参数在哪个范围,它不涉及抽样误差,所以比点(值)估计更为重 要。 ( ) 5.从正态总体 N(μ ,σ )中,随机抽取例数为 n 的样本,则样本均数 X 也服从 N(μ σ )的正态分布。 ( ) 6.抽样研究时,可通过增加样本含量来减少抽样误差。 ( ) 7.成组比较的 t 检验要求两组样本例数一定相等。 ( ) 8.可信区间比假设检验还可以提供更多信息,不但能回答差别有无统计意义,还能提 出差别有无实际意义。 ( ) 9.t 检验结果 t>1.96,可以认为两样本均数不同。 ( )18 10.样本含量相同时,配对设计与成组设计相比,前者统计效率较高 ( ) 11.在配对 t 检验中,用药前数据减去用药后数据,与用药后数据减去用药前数 据作 t 检验后的结论是相同的 ( ) 12.t 分布曲线的形状与标准差有关 ( ) 13.拒绝了实际上是成立的 Ho,这类“弃真”的错误称为第一类错误或Ⅰ型错误 ( ) 14.抽样调查是从总体中随机抽取一定数量的观察单位组成样本,然后用样本信息来 推断总体特征 ( ) 15.变量变换是各组观察值经变量转换后达到方差齐性 ( ) 16.样本均数的 99%可信区间可用 X ? 2.58 S x 表示 ( ) 17.计算总体均数可信区间的通式为( X ? t? ?? ?S X , x ? t??S X ) 缩写为 X ? t??S X ( )18.当 P≤α 时,结论为按所取α 检验水准拒绝 Ho,接受 H1;如 P>α 时,即样 本信息支持 Ho,就无理由拒绝它,此时只好接受它 ( ) 19.当 t0.01v>t>t0.05v 时,则 0.01>P>0.05 ( ) 20.两个均数比较只能用 t 检验或 u 检验 ( ) 21.t 检验可用于同一批对象的身高和体重均数差别的假设检验 ( ) 22.β 为第二类错误的概率(1-β )越小,所需的样本例数越多 ( )四、 单选题:1. 从一个计量资料的总体中抽样,产生的抽样误差的原因是: ( A ) A.总体中的个体值存在差异 B.总体均数不等于零 C.样本中的个体值存在差异 D.样本均数不等于零 E.样本只包含总体的一部分个体 2. σ x 是指: ( B ) E A.所有个体值对总体均数的离散程度 B.某一个样本均数对总体均数的离散程度 C.所有样本均数对总体均数的离散程度 D.一些样本均数对总体均数的离散程度 E.所有某个含量相同的样本均数对总体均数的离散程度 3. 在同一正态总体中随机抽样,有 99%的样本均数在下述范围内: ( D ) A. x ? 2.58s x D. ? ? 2.58? x B. ? ? 2.58s x E.以上都不是 C. x ? 2.58? x4. 在同一总体中随机抽取多个样本,用样本来估计总体均数的 95%可信区间,则估计 精密的是: ( E ) A.均数大的样本 B.均数小的样本 C.标准差小的样本 D.标准误大的样本 E.标准误小的样本 5. x ? t 0.05 (? )s x ? x ? t 0.05 (? )s x ~ x ? t 0.05 (? )s x 表示: ( D ) E A.总体的 95%个体值在该区间内 B.样本的 95%个体值在该区间内 C.平均每 100 个总体均数,有 95 个总体均数在该区间内 D.平均每 100 个样本(含量相同)均数,有 95 个样本均数在该区间内19 E.平均每 100 个样本(含量相同)有 95 个样本所得出的该区间包括总体均数 6. 总体均数的 99%可信区间为: ( E ) A. x ? 1.96 s D. x ? t 0.05 (? )s x B. x ? 1.96s x E.以上都不是 C. x ? t 0.05 (? )s7. 在由两样本均数的差别推断两总体均数的差别的 t 检验中,检验假设的无效假设 是: ( D ) A.两样本均数差别无统计意义 B.两总体均数差别无统计意义 C.两样本均数相等 D.两总体均数相等 E.两总体均数不等 8. 由两样本均数的差别推断两总体均数的差别,所谓差别有显著性是指: ( B )A A.两样本均数差别有显著性 B.两总体均数差别有显著性 C.两样本均数和两总体均数的差别都有显著性 D.其中一个样本均数和总体均数的差别有显著性 E.以上都不是 9. 在样本均数和总体均数差别的显著性检验中, H0(无效假设) : μ = μ 0 ;H1(备 择假设) :μ ≠μ 0; 结果因为 P<0.05 而拒绝 H0 接受 H1,是由于: ( D ) A.无效假设成立的可能性小于 5% B.备择假设成立的可能性大于 5% C.无效假设成立的可能性小于 5%和备择假设成立的可能性大于 95% D.该样本来自该总体(μ = μ 0)的可能性小于 5% E.该样本来自另一个总体(μ ≠μ 0)的可能性大于 95% 10. 与标准正态分布(u 分布)比较,t 分布的: ( D ) A.中心位置左移 B.中心位置右移 C.分布曲线峻峭一些 D.分布曲线平坦一些 E.以上都不是 11. 与标准正态分布(u 分布)比较,t 分布的: ( A )D(画图) A.均数要小些 B.均数要大些 C.标准差要小些 D.标准差要大些 E.以上都不是 12. 若总例数相同,则两组计量资料的 t 检验与配对计量资料的 t 检验相比较,一般 为: ( B ) A.两组计量资料的 t 检验的效率要高些 B.配对计量资料的 t 检验的效率要高些 C.两者效率相等 D.两者效率相差不大 E.两者效率不可比 13. 在两个均数比较的 t 检验中,计算合并方差的公式为: ( E ) A. S ? S ? S2 c 2 1 2 22 S12 S 2 B. S ? ? n1 n2 2 C 2 n1 S12 ? n2 S 2 n1 ? n2 ? 22 C. S C ?2 n1 S12 ? n2 S 2 n1 ? n22 D. S C ?2 E. S C ?2 (n1 ? 1) S12 ? (n2 ? 1) S 2 n1 ? n2 ? 214. 推断样本率为 16.8%与 14.5%所代表的总体有无差别,选用的方法是:( B ) A.样本均数与总体均数比较的 t 检验 B.配对 t 检验20D C.成组 t 检验 D.以上都不是 以一个数值来估计总体参数(点估计) 15. 在比较两个小样本的均数时,需改用校正 t 检验的情况是: ( D ) A.两总体均数相等 B.两总体均数不等 C.两总体方差相等 D.两总体方差不等 E.两样本方差不等 16. 在两组资料比较的 t 检验中,结果为 P<0.05,差别有显著性。P 愈小则:( C ) E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明两样本均数有差别的可能性愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 17. t 检验中,不同类型资料的 t 检验的区别是: ( B ) A.检验步骤不同 B.统计量 t 的计算公式不同 B.确定 P 值时查的表不同 D.根据 P 值判断结果的方法不同 E.以上都不对 18. 两组同质资料中,_____小的那个样本均数更有代表性 ( A ) C A.S B.CV C. S X D. X19._________小,表示用该样本均数估计总体均数的可靠性大。( C ) A.CV B.S C.S x D.R 20.统计推断的内容__________。( A ) D A.是用样本指标估计相应的总体指标 B.是检验统计上的“假设” C.A、B 均不是 D. A、B 均是 21.两样本均数比较,经 t 检验,差别有显著性时,P 越小,说明 。( D ) A.两样本均数差别越大 B.两总体均数差别越大 C. 越有理由认为两总体均数不同 D. 越有理由认为两样本均数不同C五、 问答题:1.标准差和标准误有何区别和联系? 2.可信区间和参考值范围有何不同? 3.假设检验和区间估计有何联系? 4.假设检验时,一般当 P &0.05 时,则拒绝 H0,理论依据是什么? 5.t 检验和方差分析的应用条件有何异同? 6. 怎样正确使用单侧检验和双侧检验? 7. 验假设中α 和 P 的区别何在?六、 计算题1. 某地抽样调查了部分成人的红细胞数和血红蛋白量,结果如表: 表:3-1 健康成人的红细胞和血红蛋白测得值及标准误与变异系数的计算 性别 例数 均数 标准差 标准值 红细胞数 男 360 4.66 0.58 4.84 12 (×10 /L) 女 225 4.18 0.29 4.33 血红蛋白 男 360 134.5 7.1 140.221 (g/L)女255117.610.2124.7(1)说明女性的红细胞数与血红蛋白量的变异程度何者为大? (2)分别计算男p女两项指标的抽样误差。 (3)试估计该地健康成年男p女红细胞数的均数。 (4)该地健康成年男p女间血红蛋白含量有无差别? 2. 将20名某病患者随机分为两组,分别用甲、 乙两药治疗,测得治疗前及治疗后一个月 的血沉(mm/小时)如下表,问: (1)甲,乙两药是否均有效? (2)甲,乙两药的疗效有无差别? 表3-2 甲,乙两药治疗前后的血沉 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 病人号 1 2 3 4 5 6 7 8 9 10 甲 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 药 治疗前 10 13 6 11 10 7 8 8 5 9 治疗后 6 9 3 10 10 4 2 5 3 3 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 病人号 1 2 3 4 5 6 7 8 9 10 乙 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 药 治疗前 9 10 9 13 8 6 10 11 10 10 治疗后 6 3 5 3 3 5 8 2 7 4 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ (1)甲,乙两药是否均有效? (2)甲,乙两药的疗效有无差别? 3. 将钩端螺旋体病人的血清分别用标准株和水生株作凝溶试验,测得稀释倍数如 下,问两组的平均效价有无差别? 标准株(11 人)100 水生株(9 人) 100 表 3-3 FEV1 男 2.0~ 2.5~ 3.0~ 3.5~ 4.0~ 4.5~ 5.0~22200 100400 100400 200400 200400 200800 200160032004. 表 3-3 为抽样调查资料,可做那些统计分析? 某地健康成人的第一秒肺通气量(FEV1) (L) 人 数 女 4 8 23 33 20 10 21 3 11 27 36 26 10 5.5~ 6.0~6.53 10 0合计 118 100 5.某医师就表 3-4 资料,对比用胎盘浸液钩端螺旋体菌苗对 328 名农民接种前, 后(接 种后两月)血清抗体(黄疸出血型)的变化。 表 3-4 328 例血清抗体滴度及统计量 抗体滴度的倒数 sx X 0 20 40 80 160 320 640 1280 s 免疫前人数 211 27 19 24 25 19 3 76.1 111.7 6.17 免疫后人数 2 16 57 76 75 54 25 23 411.9 470.5 25.90 t=(411.91-76.1)/ 25.9 2 ? 6.172 =12.6>3,查 t 界值故 P<0.01,说明接种后血清 抗体有增长。 试问: (1)本例属于何种类型设计? (2)统计处理上是否妥当? 6.152 例麻疹患儿病后血清抗体滴度倒数的分布如下,试作总体几何均数的点值估计 和 95%区间估计。 滴度倒数 1 2 4 8 16 32 64 128 256 512 1024 合计 人 数 0 0 1 7 10 31 33 42 24 3 1 152 7.某医院对 9 例慢性苯中毒患者用中草药抗苯 1 号治疗:得表如下: 表 3-5 9 例慢性苯中毒患者治疗前后的白细胞总数(×109/L) 病人号 治疗前 治疗后 1 6.0 4.2 2 4.8 5.4 3 5.0 6.3 4 3.4 3.8 5 7.0 4.4 6 3.8 4.0 7 6.0 5.9 8 3.5 8.0 9 4.3 5.0 (1)问该药是否对患者的白细胞总数有影响? (2)同样得治疗后血小板比治疗前每人平均增加 37.8×109/L,并算得 t=4.1,问 该药是否对患者的血小板有影响? (3)综合上述结果能否提出进一步研究意见.答案填空题: 1. 标准误 2. 0.05,0.01 3. 假设检验, (显著性检验) 4. 两总体均数不同(越有理由说明有统计学意义) 5. 自由度大小 6. 一是准确度、二是精度 7. 抽样误差、样本均数、总体均数 8. 总体均数估计、假设检验23 9. 第二类错误(Ⅱ型错误) β 是非题: 1. √ 2. × 3. × 4. × 5. √ 6. √ 7. × 8. √ 9. × 10. √ 11. √ 12. × 13. √ 14. √ 15. √ 16. √ 17. √ 18. √ 19. × 20. × 21. × 22. × 单选题: 1. A 2. E 11. D 12. B 21. C3. D 13. E4. E 14. D5. E 15. D6. E 16. E7. D 17. B8. A 18. C9. D 19. C10. D 20. D问答题: 1.标准差和标准误有何区别和联系?表 3-6 标准差与标准误的区别意义上 应用上标准差(α 或 s) 描述一组变量值之间的离散趋势 ① s 越小,表示变量值围绕 均值分布越密集,说明均数 的代表性越好。标准误( ax或sx ) 描述样本均数间的离散趋势① sx 越小,表示样本均数与 总体均数越接近,说明样本 均数推断总体均数可靠性越大。② 可用 X ? ua s 估计变量值分 ② 可用 X ? t a , v sx 估计总体 布范围 均数可信区间与 n 的关系 n 越大,s 越趋于稳定 n 越大, sx 越小 (2)联系 ① 二者均是表示变异度大小的统计指标。 ② 标准误 ?x ? ? / n 与标准差大小成正比,与抽样例数 n 的平方根成反 比。 ③ 当 n 一定时,同一份资料,标准差越大,标准误也越大。 2.可信区间和参考值范围有何不同? 参考值范围是指同质总体中个体变量值的分布范围,如 X±1.96s 说明有 95%的变量值分布在此范围内,它与标准差的大小有关,若个体变异越大, 该范围越宽,分布也就越散。而可信区间是指在可信度为(1-α )时,估 计总体参数可能存在的范围。即从同一总体中随机抽样,当 n 一定时,每 抽一次即可得一个样本均值, 以 X ? t a , v sx 计算可信区间, 如 95%可信区间, 类似的随机抽样进行一百次,平均有 95 次,即有 95 个可信区间包括了总 体均数,有 5 次没有包括括总体均数,5%是小概率事件,实际发生的可能 性很小,因此实际应用中就认为总体均数在求得的可信区间。这种估计方 法犯错误的可能性最大不超过 5%。可信区间与标准误大小有关,标准误越24 大,可信区间则越大。 3.假设检验和区间估计有何联系? 假设检验和区间估计都属于统计推断的内容。假设检验用以推断总体参数间 是否有质的区别,并可获得样本统计量,以得到相对精确的概率值。而可信 区间用于推断总体参数的大小,它不仅可用以回答假设检验的问题,尚可比 假设检验提供更多的信息。但这并不意味着用可信区间代替假设检验,因为 假设检验可得到 P 值,比较精确地说明结论的概率保证,而可信区间只能告 诉我们在某α 水准上有无统计意义, 却不能像 P 那样提供精确的概率。 因此, 只有将二者有机地结合起来,相互补充,才是完整的分析。 4.假设检验时,一般当 P &0.05 时,则拒绝 H 0,理论依据是什么? 假设检验时,当 P<0.05,则拒绝 Ho,其理论依据是在 Ho 成立的条件下, 出现大于等于现有检验统计量的概率 P<0.05,它是小概率事件,即在一次 抽样中得到这么小概率是事件是不大可能发生的,因而拒绝它。由此可见, 假设检验的结论是具有概率性的,它存在犯错误的可能性小于等于 0.05。 5.t 检验和方差分析的应用条件有何异同? (1)相同点:在均数比较中,t 检验和方差分析均要求各样本来自正态总体;各处理 组总体方差齐且各随机样本间相互独立,尤在小样本时更需注意。 (1) 不同点:t 检验仅用于两组资料的比较,除双侧检验外,尚可 进行单侧检验,亦可计算一定可信度的可信区间,提示差别有无实际意义。而方 差分析用于两组及两组以上均数的比较,亦可用于两组资料的方差齐性检验。 6. 怎样正确使用单侧检验和双侧检验? 根据专业知识推断两个总体是否有差别时,是甲高于乙,还是乙高于甲,两种可 能都存在时,一般选双侧;若根据专业知识,如果甲不会低于乙,或研究者仅关心 其中一种可能时,可选用单侧。一般来讲,双侧检验较稳妥故较多用,在预实验有 探索性质时,应以专业知识为依据,它充分利用了另一侧的不可能性,故检出效率 高,但应慎用。 7. 第一类错误与第二类错误的区别及联系何在?了解这两类错误有何实际意义? (1)假设检验中Ⅰ、Ⅱ型错误的区别。 Ⅰ型错误是拒绝了实际上成立的 Ho,也称为“弃真”错误,用α 表 示。统计推断时,根据研究者的要求来确定。 Ⅱ型错误是不拒绝实际上不成立的 Ho,也称为“存伪”错误,用β 表示。它只能与特定的 H1 结合起来才有意义,一般难以确切估计。 (2)Ⅰ、Ⅱ型错误的联系。 ① 当抽样例数一定时,α 越大,β 越小;反之,α 越小,β 越大。 ② 统计推断中,Ⅰ、Ⅱ型错误均有可能发生,若要使两者都减小, 可适当增加样本含量。 ③ 根据研究者要求,n 一定时,可通过确定α 水平来控制β 大小。 (3)了解两类错误的实际意义。 ① 可用于样本含量的估计。 ② 可用来计算可信度(1-α ) ,表明统计推断可靠性的大小。 ③ 可用于计算把握度(1-β ) ,来评价检验方法的效能等。 ④ 有助于研究者选择适当的检验水准。 ⑤ 可以说明统计结论的概率保证。25 计算题: 1. 某地抽样调查了部分成人的红细胞数和血红蛋白量,结果如表:健康成人的红细胞和血红蛋白测得值及标准误与变异系数的计算 性别 例数 均数 标准差 标准值 变异系数(%) 标准误 红细胞数 男 360 4.66 0.58 4.84 12.45 0.0306 12 (×10 /L) 女 225 4.18 0.29 4.33 6.94 0.0182 血红蛋白 男 360 134.5 7.1 140.2 5.28 0.3742 (g/L) 女 255 117.6 10.2 124.7 8.67 0.6387 (1)说明女性的红细胞数与血红蛋白量的变异程度何者为大? 女性 CVRBC=S/ x ×100%=0.29/4.18×100%=6.49% CVHB=S/ x ×100%=10.2/117.6×100%=8.67% 由上计算可知该地女性血红蛋白量比红细胞数变异度大 (2)分别计算男p女两项指标的抽样误差。 见上表最后一栏,标准误计算公式 s x ? s / n 。 (3)试估计该地健康成年男p女红细胞数的均数。 健康成年男子红细胞数总体均数 95%可信区间为: X ±1.96Sx=4.66±1.96×0.~4.72(1012/L) 其中 n=360 故近似按 υ =∞。 同理健康成年女子红细胞数总体均数 95%可信区 12 间为 4.14~4.22(10 /L) (4)该地健康成年男p女间血红蛋白含量有无差别? Ho:? 男=? 女 H1:? 男≠? 女 α =0.05 u= ( X 1 ? X 2 ) /(sx1 ? x2 ) ? (134.5 ? 117.6) / 7.2 2 / 360? 10.2 2 / 255 =22.83 按υ =∞,查附表 2,得 P<0.0005,按 α =0.05 水准,拒绝 Ho,接受 H1,可 以认为男女间血红蛋白含量不同,男高于女。 2. 将20名某病患者随机分为两组,分别用甲、 乙两药治疗,测得治疗前及治疗后一个月 的血沉(mm/小时)如下表,问: (1)甲,乙两药是否均有效? (2)甲,乙两药的疗效有无差别? 表3-8 甲,乙两药治疗前后的血沉 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 病人号 1 2 3 4 5 6 7 8 9 10 甲 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 药 治疗前 10 13 6 11 10 7 8 8 5 9 治疗后 6 9 3 10 10 4 2 5 3 3 差 值 4 4 3 1 0 3 6 3 2 6 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 病人号 1 2 3 4 5 6 7 8 9 1026表 3-7: 乙 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 药 治疗前 9 10 9 13 8 6 10 11 10 10 治疗后 6 3 5 3 3 5 8 2 7 4 差 值 3 7 4 10 5 1 2 9 3 6 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ (1)甲,乙两药是否均有效? 经计算得: 甲药 d =3.2000(mm/h) 乙药 d =5.0000(mm/h) Sd =1.9322(mm/h) Sd =2.9810(mm/h) S d =0.6110(mm/h) S d =0.9428(mm/h) n=10 n=10 Ho:μ d=0 Ho:μ d=0 H1:μ d≠0 H1:μ d≠0 α =0.05 α =0.05 t(甲药)= d / S d =3.0=5.237 t(乙药)= d / S d =5.8=5.303 ? =9,查 t 界值表,得 P<0.001,按α =0.05 水准,拒绝 Ho,接受 H1,故可认为 甲、乙两药均有效。 (2)甲,乙两药的疗效有无差别? 由表中资料分别求得治疗前后差值(见表 3-8) ,再作两组比较。 H0 :甲乙两药疗效相同 H1 :甲乙两药疗效不同 α =0.052 SC 2 (n1 ? 1) s 2 9 ? 1.9322 2 ? 9 ? 2. ?(n2 ? 1) s 2 ? ? ? 6.3110 n1 ? n2 ? 2 10 ? 10 ? 22 S d 1?d 2 ? sc (1/ n1 ? 1/ n2 ) ? 6. ? 1/10) ? 1.2622 ? 1.1235t?d 1 ? d 2 3.2 ? 5.0 ? ? ?1.6022 Sd 1 ? d 2 1.1235? =18,查 t 界值表,得 0.20>P>0.10,按α =0.05 水准,不拒绝 Ho,尚不 能认为甲乙两药疗效有差别。 3. 将钩端螺旋体病人的血清分别用标准株和水生株作凝溶试验,测得稀释倍数如 下,问两组的平均效价有无差别? 标准株(11 人)100 200 400 400 400 400 800 00 3200 水生株(9 人) 100 100 100 200 200 200 200 400 400 由题知:该资料服从对数正态分布,故得: 标准株 水生株 n=11 n=9X lg x1 =2.7936X lg x 2 =2.267627 S lg x1 =0.4520S lg x 2=0.2355(1)两组方差齐性检验:2 H0: ? 2 1?? 2 2 H1: ? 2 1?? 2? =0.052 2 F= S 大 /S 小 ? 0.45202 / 0.23552 ? 3.684V1 =10 V2 =8 F0.05(10,8)=4.30 查附表 3,得 P>0.05,按α =0.05 水准,不拒绝 Ho,可以认为两总体方差齐。 (2)两组均数比较; H0 两总体几何均数相等 H1 两总体几何均数不等 α =0.05t? ?X1 ? X 2 ? SX 1 ? X 2X1 ? X 2 S (1 / n1 ? 1 / n2 )2 C?X1? X 2 [(n1 ? 1) s ?(n2 ? 1) s 2 1 / n1 ? 1 / n2 ) 2 ] /(n1 ? n 2 ? 2)(2 12.6 [((11 ? 1)0.45202 ? (9 ? 1)0.23552 ) /(11 ? 9 ? 2)] ? (1 / 11 ? 1 / 9)? 3.149查 t 界值表,得 0.01>P>0.005,按α =0.05 水准,拒绝 Ho,接受 H1,故可认为钩 端螺旋体病人的血清用标准株和水生株作凝溶试验,前者平均抗体效价高于后者 4. 表 3-9 为抽样调查资料,可做那些统计分析?表 3-9 FEV1某地健康成人的第一秒肺通气量(FEV1) (L) 人 男 数 女 4 8 23 33 20 10 2 02.0~ 2.5~ 3.0~ 3.5~ 4.0~ 4.5~ 5.0~ 5.5~281 3 11 27 36 26 10 3 6.0~6.5 合计 (1)统计描述。1 1180 100由上表可见, 男性调查 118 人, 第 1 秒肺通气量分布为 2.0~6.5, 高峰位于 4.0~ 4.5 组段内,以中间频数分布最多,两侧逐渐减少,左右基本对称,其频数分布可 见上表和下图。 女性调查 100 人, 第 1 秒肺通气量分布为 2.0~2.5, 高峰位于 3.5~ 4.0 组段内,以中间频数分布最多,两侧逐渐减少,且左右大体对称,频数分布可 见表 3-9 和图 3-1。40男女302010 0 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5图 3-1 某地健康成人第一秒肺通气量(FEV1) (L)分布 由上表和图可见,男性分布范围较宽,右侧尾部面积向外延伸两个组段,高峰 位置高于女性,向右推移一个组段。 (2)计算集中与离散趋势指标,并对两组进行比较。 Ho:男女间第 1 秒肺通气量总体均数相同 H1:男女间第 1 秒肺通气量总体均数不同 α =0.05 男性: n=118 女性: n=100X 1 =4.2373X 2 =3.7250s1=0..62582 / n2 u= ( X 1 ? X 2 ) / sx1 ? x 2 ? ( X 1 ? X 2 ) / S12 / n1 ? s 22 =(4.0)/ 0.69022 / 118? 0.6258 / 100=5.624 查 t 界值表,v=∞,得 P<0.001,按α =0.05 水准,拒绝 Ho,接受 H1,故可认为 男女间第 1 秒肺通气量均数不同,男高于女。 (3)根据上述分析结果,分别确定 95%参考值范围。29 男性第 1 秒肺通气量单侧 95%参考范围下限为:X ? u0.05 s =4. ? 0. (L)即可认为有 95%的男性第 1 秒肺通气量不低于 3.16(L) 女性第 1 秒肺通气量单侧 95%参考范围下限为:X ? u0.05 s =3. ? 0. (L)即可认为有 95%的女性第 1 秒肺通气量不低于 2.69(L) 5. 某医师就表 3-10 资料,对比用胎盘浸液钩端螺旋体菌苗对 328 名农民接种前, 后 (接 种后两月)血清抗体(黄疸出血型)的变化。 表 3-10 328 例血清抗体滴度及统计量 抗体滴度的倒数 0 20 40 80 160 320 640
19 24 25 19 3 2 16 57 76 75 54 25 23免疫前人数 免疫后人数sx X s 76.1 111.7 6.17 411.9 470.5 25.90t=(411.91-76.1)/ 25.9 2 ? 6.172 =12.6>3,查 t 界值故 P<0.01,说明接种后血 清抗体有增长。 试问: (2) 本例属于何种类型设计? 本例属于自身配对设计。 (3) 统计处理上是否妥当? 统计处理上不妥当,因为:① 在整理资料过程中,未按配对设计整理,而是拆开 对子按成组设计整理,失去原设计的意义。② 统计描述指标使用不当,血清浓度 是按倍比稀释,不适合计算算术均数、标准差、因为有零值,也不宜计算几何均数。 对现已整理好的资料, 可计算中位数表示平均水平, 用四分位数间距表示离散趋势。 ③ 假设检验因本资料不宜计算均数,故对均数进行 t 检验当然是不妥当的。 6.152 例麻疹患儿病后血清抗体滴度倒数的分布如下,试作总体几何均数的点值估计 和 95%区间估计。 滴度倒数 1 2 4 8 16 32 64 128 256 512 1024 合计 人 数 0 0 1 7 10 31 33 42 24 3 1 152 以滴度倒数 X 的对数值求得 X1gx =1.85965 ,Slgx=0.44245, n=152, 则点值 估计 G=lg-1 1. 患儿病后血清抗体滴度倒数总体均数 95%可信区间为 lg-1(Xlgx+1.96Slgx/√n) = lg-1(1.×0.44245/√152) = lg-1(1..) =61.5~85.117.某医院对 9 例慢性苯中毒患者用中草药抗苯 1 号治疗:30 (1)得表 白细胞总数(×109/L) ,问该药是否对患者的白细胞总数有影响?表 3-119 例慢性苯中毒患者治疗前后的白细胞总数 d1 1.8 -0.6 -1.3 -0.4 2.6 -0.2 0.1 -4.5 -0.7病人号 治疗前 治疗后 1 6.0 4.2 2 4.8 5.4 3 5.0 6.3 4 3.4 3.8 5 7.0 4.4 6 3.8 4.0 7 6.0 5.9 8 3.5 8.0 9 4.3 5.0 H0 该药对患者的白细胞总数无影响,即μ d=0 H1 该药对患者的白细胞总数有影响,即μ d≠0 α =0.05 求得(前―后)差值 di 经计算得:d=0.3556Sd=1.9951n=9t= d ? 0 /( s d / n ) ? ? 0.3556 /(1.9551 / 9 ) ? 0.534? =8 查附表 2,t 界值表,得 P>0.5,按α =0.05 水准,不拒绝 Ho,尚不能认为该药对患者的白细胞总数有影响。 ( 2 )同样得治疗后血小板比治疗前每人平均增加 37.8 × 109/L ,并算得 t=4.1,问该药是否对患者的血小板有影响? H0 该药对患者的血小板无影响,即μ d=0 H1 该药对患者的血小板有影响,即μ d≠0 α =0.05d =37.8t=4.1? =8查附表 2,t 界值表,得 0.005>P>0.002,按α =0.05 水准,拒绝 Ho, 接受 H1,故可认为该药对患者的血小板有影响,可增加患者血小板。 (3) 综合上述结果能否提出进一步研究意见/综合上述结果, 提出以下建议: ① 在此项研究中, 从 t 检验结果来看, 血小板 治疗前后变化有意义, 而白细胞则无意义, 可补充计算两项指标的 95%可信区间, 结合专 业知识,分析治疗前后指标差数有无实际意义。 ② 如有可能扩大样本,追踪观察该药对苯中毒患者的远期疗效31 第四章一、 填空题:方差分析1、方差分析的应用条件是___________、___________和___________。 2、方差分析的基本思想把变量值看成三种不同的变异,即___________,___________ 和___________三种变异关系___________。 3、多个样本均数间每两个均数的比较常用的统计方法是___________。 4、在单因素方差分析中,其各自由度之间的关系是__________。二、 是非题:1.四个样本均数的比较,不可以两个两个抽出来作 t 检验 ( ) 2.两样本均数的检验,可使用两样本 t 检验,亦可以用方差分析 ( ) 3.方差不齐的两个小样本均数检验可采用两样本均数的 t 检验 ( ) 4.多个样本均数的两两比较有两种方法可供选择,一是用 t 检验对每两个对比 组作比较,二是先作方差分析然后作多重比较 ( ) 5.与单因素方差分析相比,两因素方差分析由于从总变异中多分离出配伍组变异,使 计算值的分母缩小了,因而提高了研究的效率。 ( )三、 单选题:1. 在相同自由度(? 1 ,? 2 )及α 水准时,方差分析的界值比方差齐性检验的界值__B_ A. 大 B.小 C.相等 D.不一定 2. 成组设计的方差分析中,必然有___ _D___ A. SS组内 < SS组间 B . MS组间 < MS组内 C. MS总 = MS组间 + MS组内 D . SS总 = SS组间 + SS组内 3.在单因素方差分析中: ( E ) A.只要求资料是计量的 B.只要求资料呈正态分布 C.只要求方差齐性 D.要求资料是计量的,且呈正态分布 E.要求资料正态,且方差齐性 4.单因素方差分析的无效假设是:( A ) B A.各对比组样本均数相等 B.各对比组总体均数相等 C.至少有两个对比组总体均数相等 D.各对比组总体均数差别无显著性 E.各对比组总体均数不等 5.在 K 组每组 n 例的单因素方差分析中,组间变异的离均差平方和为:( D ) C A. SS组间 ? ? (X i ? X ) 2i ?1kkB. SS组间 ? ? K (X i ? X ) 2i ?1k2kC. SS组间 ? ? n(X i ? X )i ?1D. SS组间( X i ? X )2 ?? K i ?1E. SS组间 ? ?i ?1k( X i ? X )2 n32 6.在单因素方差分析中若处理因素无作用,理论上应有:( A.F=O B.F=1 C.F<1.96 D.F< F0.05( n'1 , n'2 )B)AE.以上都不是7.对成对的两组资料作均数差别的假设检验:( C ) A.只能用随机区组 F 检验 B.只能用配对 t 检验 C.用随机区组 F 检验或配对 t 检验都可 D.只能用成组 t 检验 8.在多组均数的两两比较中,若不用 q 检验而用 t 检验,则:( D ) C A.结果更合理 B.结果会一样 C.会把一些无差别的总体判断为有差别 D.会把一些有差别的总体判断为无差别 E.以上都不对四、 计算题:1. 某湖水不同季节氯化物含量测定值如表 2-4 所示,问不同季节氯化物含量有无差 别? 表 4-1: 某湖水不同季节氯化物含量(mg/L) 春 夏 秋 冬 22.6 19.1 18.9 19.0 22.8 22.8 13.6 16.9 21.0 24.5 17.2 17.6 16.9 18.0 15.1 14.8 20.0 15.2 16.6 13.1 21.9 18.4 14.2 16.9 21.5 20.1 16.7 16.2 21.2 21.2 19.6 14.8 1. 试就下表资料说明大白鼠感染脊髓灰质炎病毒后,再作伤寒或白日咳预防接种 是否会影响生存日数? 表 4-2 : 各组大鼠接种后生存日数 伤寒 5 7 8 9 10 10 11 11 1233百日咳 6 6 7 8 9 9 10 10 11对照 8 9 10 10 11 12 12 14 16 3.研究酵解作用对血糖浓度的影响,从 8 名健康人中抽取血液并制备了血滤液,每一 个受试者的血滤液又分成 4 份,再随机地把 4 份血滤液分别放置 0,45,90,135 分钟, 然后测定其中血糖浓度(mmol/L):结果如下表放置不同时间血滤液所含血糖浓度(mmol/L) 受试者编号 放置时间 小计 0 45 90 135 1 5.27 5.27 4.49 4.61 19.64 2 5.27 5.22 4.88 4.66 20.03 3 5.88 5.83 5.38 5.00 22.09 4 5.44 5.38 5.27 5.00 21.09 5 5.66 5.44 5.38 4.88 21.36 6 6.22 6.22 5.61 5.22 23.27 7 5.83 5.72 5.38 4.88 21.81 8 5.27 5.11 5.00 4.44 19.82 试比较 0 分钟与其他 3 个放置时间的血糖浓度间是否存在差别?. 4.某医师为研究人体肾上腺皮质 3? ? HSD (羟基类固醇脱氢酶)活性在四个季节中是 否有差别,采用分光光度计随机测定了部分研究对象,数据见表,请做统计分析. 表 4-4: 四个季节的人体肾上腺皮质 3? ? HSD 活性 季节 春季 夏季 秋季 冬季 n 42 40 32 36X 0.78 0.69 0.68 0.58表 4-3S 0.13 0.20 0.14 0.20答案填空题 1. 各样本是相互独立的随机样本,各样本来自正态总体, 处理组总体方差相等(方差齐性) 2. 总变异、组内变异、组间变异 SS 总=SS 组间+SS 组内 3. q 检验(又称 Newman-Keuls 法) 4. V 总=SS 组间+SS 组内 是非题: 1. × 2. √3. ×4. √5. ×单选题: 1. B 2. D3. E4. B5. C6. A7. C8. C计算题:34 1.某湖水不同季节氯化物含量测定值如表 2-4 所示,问不同季节氯化物含量有无差 别?表 4-1: 春 22.6 22.8 21.0 16.9 20.0 21.9 21.5 21.2 167.9 8 20.99 98某湖水不同季节氯化物含量(mg/L) 夏 19.1 22.8 24.5 18.0 15.2 18.4 20.1 21.2 159.3 8 19.91 .5555 秋 18.9 13.6 17.2 15.1 16.6 14.2 16.7 19.6 131.9 8 16.49 .5098 冬 19.0 16.9 17.6 14.8 13.1 16.9 16.2 14.8 129.3 8 16.16 .4712∑Х ij ni X ∑Х ?ij S?i∑ 588.4 32 8.39 .0166(1)多组均数间比较: 表 1: 方差分析表 变异来源 SS v MS F 总 变 异 281.635 31 组间变异 141.170 3 47.057 9.380 组内变异 140.465 28 5.017 查 F 界值表,得 P<0.01,按 0.05 水准,拒绝 H0,接受 H1,故可认为不同季 节湖水中氯化物含量不同或不全相同。 (2)各组均数间两两比较 H0 :μ A=μ B H1 :μ A≠μ B α =0.05 表2 组 别 春 X 20.99 位 次 135四个样本均数顺序排例 夏 秋 19.91 16.49 2 3冬 1 4 四组均数两两比较 q 检验 对比组 两均数之差 组数 q值 P值 1与4 4.83 4 6.099 &0.01 1与3 4.50 3 5.682 &0.01 1与2 1.08 2 1.364 &0.05 2与4 3.75 3 4.735 &0.01 2与3 3.42 2 4.319 &0.01 3与4 0.33 2 0.417 &0.05 春与夏、秋与冬湖水中氯化物含量 P>0.05,按α =0.05 水准不拒绝 Ho,即尚不能 认为春与夏、秋与冬季湖水中氯化物含量有差别。除这两对比组外,其它 4 组均 P <0.01,按α =0.05 水准,拒绝 Ho,接受 H1,即可认为春夏两季湖水中氯化物含 量高于秋冬两季。表32.试就表 4-2 资料说明大白鼠感染脊髓灰质炎病毒后,再作伤寒或白日咳预防接种是 否会影响生存日数?表 4-2 伤寒 5 7 8 9 10 10 11 11 12 92 10各组大鼠接种后生存日数 百日咳 6 6 7 8 9 9 10 10 11 84 10 对照 8 9 10 10 11 12 12 14 16 112 10∑Х ij ni∑ 288 3036 Xi2 ∑ X ij9.2 886 4.4008.4 732 2.93311.2 9.6 3si2解Ⅰ:假定生存日数服从正态分布 (1)方差齐性检验:2 2 Ho:三总体方差齐即 ? 12 ? ? 2 ? ?3H1:三总体方差不等或不全相等。 α =0.052 sc ? ? si2 (ni ? 1) /( N ? k ) ? 9(4.4+2.933+5.733)/(30-3)=4.35532 ?(n i ? 1) ln(s c / s i2 ) x ? 1 ? 1 /[3(k ? 1)] ? ??1 /(n i ? 1)? ? 1 /(N ? k ) 2?9 ? ?ln(4.) ? ln(4.) ? ln(4.)? 1 ? 1 / ?3( 3 ? 1)? ? ?3 ? 1 / 9 ? 1 /( 30 ? 3)?=0.9461 v=2,查附表 9,X?界值表,得 0.75>P>0.50,按α =0.05 水准,不拒绝 Ho,故可认为三组资料总体方差齐。 (2)三组均数比较(表 4-5) Ho:大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数相等。 H1:大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数不等或不全 相等 α =0.05 C=(∑∑Χ ij)2/n=288?/30=2764.8 SS 总=∑∑Χ ij2-C=.8=159.2 SS 组间=∑(∑Χ ij)2/ni-C = [ 92?+84?+112? ]/10-2764.8 = 41.6 SS 组内= SS 总-SS 组间=159.2-41.6=117.6 表 4-5 方差分析表 变异来源 SS v MS F 总变异 159.2 29 组间变异 41.6 2 20.8 4.776 组内变异 117.6 27 4.3556 查附表 4,得 0.05>P>0.01,在α =0.05 水准上,拒绝 Ho,接受 H1,故 可以认为大白鼠感染脊髓灰质炎病毒后,在接种伤寒或百日咳菌苗对生存 日数有影响。 (3)均数间多重比较:37 Ho:任一组与对照组总体均数相同 H1:任一组与对照组总体均数不同 α =0.05 伤寒与对照组比较t 伤、对 ??((nX1 ? X 22 112 ? 1) s ? (n2 ? 1) s 2 ) /(n1 ? n2 ? 2) (1 / n1 ? 1 / n2 )?=(11.2-9.2)/ 4. ? 1/ 10) =2/0..1428 v=27,得 0.05>P>0.02,按α =0.05 水准,拒绝 Ho,接受 H1,故可认为接 种伤寒菌苗组较对照组生存日数减少。 百日咳与对照组比较t百、对 ? (11.2 ? 8.4) / 4. ? 1/ 10) ? 2.99998v=27,查附表 2,得 0.01>P>0.005,按α =0.05 水准,拒绝 Ho,接受 H1, 可以认为接种百日咳菌苗组较对照组生存日数减少。 3.研究酵解作用对血糖浓度的影响,从 8 名健康人中抽取血液并制备了血滤液,没一 个受试者的血滤液又分成 4 份,再随机地把 4 份血滤液分别放置 0,45,90,135 分钟, 然后测定其中血糖浓度(mmol/L) (1)4 组血滤液方差齐性检验: Ho:不同放置时间血滤液所含血糖浓度总体方差相等,2 2 2 即 ? 12 ? ? 2 ? ?3 ? ?4H1:不同放置时间血滤液所含血糖浓度总体方差不等或不全相等 α =0.05 方差齐性检验方法同本例 X?=1.16847 v=k-1=4-1=3,查附表 9,X?界值表,得 0.90>P>0.75,按α =0.05 水 准,不拒绝 Ho,可以认为放置不同时间血滤液所含血糖浓度总体方差齐。 表 4-3 放置不同时间血滤液所含血糖浓度(mmol/L) 受试者编号 放置时间 受试者小计 0 45 90 135 1 5.27 5.27 4.49 4.61 19.64 2 5.27 5.22 4.88 4.66 20.03 3 5.88 5.83 5.38 5.00 22.09 4 5.44 5.38 5.27 5.00 21.09 5 5.66 5.44 5.38 4.88 21.36 6 6.22 6.22 5.61 5.22 23.27 7 5.83 5.72 5.38 4.88 21.81 8 5.27 5.11 5.00 4.44 19.82 Σ Χ ij 44.84 44.19 41.39 38.69 169.11 ni 8 8 8 8 838 Xi2 ∑ X ij5.6 0.12455.1 0.13895.17384.83635.9 0.1143215.5 0.4s i2(2)配伍组设计方差分析: 处理:Ho:不同放置时间血滤液所含血糖浓度相同 H1:不同放置时间血滤液所含血糖浓度不同或不全相同相同 α =0.05 配伍:Ho:8 位受试者血液所含血糖浓度相同 H1:8 位受试者血液所含血糖浓度不同或不全相同 α =0.05 С =(Σ Σ Ⅹij)2/n=169.112/32=893.6935 SS 总=Σ Σ Ⅹij2-С =899.5=6.1844 1 SS 放置时间= ?(? X ij ) 2 ? C b =(44.842+44.192+41.392+38.692)/8-893.24 SS 受试者= 1/ k ?(? X ij ) 2 ? C =1/4(19.642+20.032+22.092+21.092+21.362+23.272 +21.812+19.82)-893.93 SS 误差=SS 总-SS 放置时间-SS 受试者 =6.24-2.32 方差分析表 SS v MS F 6... 2.. 0..0(3,21)=3.07 F0.01(3,21)=4.87 F 0.05(7,21)=2.49 F 0.01(7,21)=3.64 放置时间受试者间均 P<0.01,按α =0.05 水准,均拒绝 Ho,接受 H1,故 可认为不同放置时间、不同受试者间血滤液所含血糖浓度不同或不全相 同。 (3)不同放置时间血滤液所含血糖浓度均数间多重比较,采用多个实验组 与一个对照组均数间两两比较。 ① Ho:放置 45 分钟与 0 分钟血滤液所含血糖浓度相同 H1:放置 45 分钟与 0 分钟血滤液所含血糖浓度不同 α =0.05 变异来源 总 变 异 放置时间 受 试 者 误 差 查 F 界值表39 t ? (5.8 ) / 0.0 ? 1/ 8)=0.71=1.16476 v=n-k=32-4=28,查附表 2,t 界值表,得 0.40>P>0.20,按α =0.05 水准,不拒绝 Ho,尚不能认为放置 45 分钟与 0 分钟血滤液血糖浓度总均 数有差别。 ② Ho:放置 90 分钟与 0 分钟血滤液所含血糖浓度相同 H1:放置 90 分钟与 0 分钟血滤液所含血糖浓度不同 α =0.05t ? (5.3 ) / 0.0 ? 1/ 8)=0.7=6.1853 v=28,查附表 2,t 界值表,得 P<0.001,按α =0.05 水准,拒绝 Ho, 接受 H1,可认为放置 90 分钟较 0 分钟血滤液所含血糖浓度减少。 ③ Ho:放置 135 分钟与 0 分钟血滤液所含血糖浓度相同 H1:放置 135 分钟与 0 分钟血滤液所含血糖浓度不同 α =0.05t ? (5.3 ) / 0.0 ? 1/ 8)=0.7 =11.0265 v=28,查附表 2,t 界值表,得 P<0.001,按α =0.05 水准,拒绝 Ho, 接受 H1,故可认为放置 135 分钟较 0 分钟血滤液所含血糖浓度减少。 4.某医师为研究人体肾上腺皮质 3? ? HSD (羟基类固醇脱氢酶)活性在四个季节中是 否有差别,采用分光光度计随机测定了部分研究对象,数据见表 2.8,请做统计分析. 表 4-4 季节 四个季节的人体肾上腺皮质 3? ? HSD 活性 nXS 0.13 0.22 0.14 0.20春季 42 0.78 夏季 40 0.69 秋季 32 0.68 冬季 36 0.58 解: 本题仅给出分析思路及主要结果 1 . 采用完全随机设计资料的方差分析: (1)由公式 X ?? X 可推得n2? X ? nXn ? s 2 (n ? 1)由方差公式可推得 ? X ?(? X ) 2(2)计算 SS 总 SS 组间 SS 组内 SS 总=5.365, SS 组间= 0.777 SS 组内=4.58840 列出方差分析表 方差分析表 变异来源 SS MS F v 总变异 5.365 149 组间变异 0.777 3 0. 组内变异 4.588 146 0.0314 (4)确定 P 值,判断结果 查方差分析表,得 P&0.01,在 ? =0.05 水准上,拒绝 Ho,接受 H1 ,可以认为四个 季节人体肾上腺皮质 3? ? HSD (羟基类固醇脱氢酶)活性不同或不全相同. 2.进一步作均数间的多重比较分析(略)第五章一、 名词解释:1. 相对数 4. 相对比相对数2. 率 5. 标准化率法3. 构成比二、 填空题:1、分析时不能以构成比代替率,构成比只能说明事物各组成部分的__________不能说 明某现象发生的___________。 2、反映某现象实际发生频数与可能发生频数的比值可选用___________。 3、率的标准化目的是______________________。 4、常用的相对数有___________、___________和___________。 5、从同一个总体中随机抽出观察相等的多个样本,样本率与总体率,各样本率之间往 往有差异,这种差异被称作___________用___________表示。三、 是非题:1.标准化就是采用统一的标准对内部构成不同的各组频率进行调整和对比的方 法 ( ) 2.构成比的计算公式是:构成比=甲指标/乙指标×100% ( ) 3.某年某地出生男婴数除以出生女婴数是相对比 ( ) 4.计数资料的假设检验样本要满足 np 与 n(1-p)≥5 的条件 ( ) 5.计算相对数时分母不宜过小 ( ) 6.比较两地胃癌死亡率,若两地胃癌死亡率相等就不必进行率的标准化 ( ) 7.某现象实际发生数与可能发生数之比称为构成比 ( ) 8. 标准化后的率已消除了内部构成不同对总率产生的影响故可直接比较其大小 ( ) 9.三个医院的门诊构成作比较时不可作χ ?检验 ( ) 10.由于标准化率有利于数据间比较,故绝大多数统计指标需先进行标准化,而无需 考虑是否存在内部构成间的不同 ( ) 11.率又称频率指标,它说明某现象发生的比重或分布,常以百分率(%) 、千分 率( 0 00 ) 、万分率(1/万)等表示 ( )41 四、 单选题:1. 在实际工作中,发生误把构成比作率分析的主要原因是由于:D A.构成比和率的计算方法一样 B. 构成比较率容易计算 C. 构成比较率难于计算 D. 计算构成比的原始资料较计算率的原始资料容易得到 E. 计算构成比的原始资料较计算率的原始资料难于得到 2. 要比较甲乙两厂某工种工人患某职业病的患病率的高低,采取标准化法的原理是 E A. 假设甲乙两厂的工人数相同 B. 假设甲乙两厂某工种的工人数相同 C. 假设甲乙两厂患某职业病的工人数相同 D. 假设甲乙两厂工人的工龄构成比相同 E. 假设甲乙两厂某工种工人的工龄构成比相同 3. 经调查得甲乙两地的冠心病粗死亡率都为 40/万,按年龄构成标化后,甲地冠 心病标化死亡率为 45/万,乙地为 31/万,因此可以认为:C A A. 甲地年龄别人口构成较乙地年轻 B. 乙地年龄别人口构成较甲地年轻 C. 甲地冠心病的诊断较乙地准确 D. 乙地冠心病的诊断较甲地准确 E. 甲地年轻人患冠心病较乙地多 4. 在医学科研中,率的标化,经常采用全国人口的性别年龄构成,其理由是:D A. 这样算得的标准化率比较合理 B. 这样算得的标准化率比较准确 C. 计算标准化率比较容易 D. 便于进行比较 E. 以上都不是 5. 比较甲乙两县的食管癌死亡率,以甲乙两县合计的人口构成为标准,设以各年 龄组人口数为标准算得标化率为 P1,以各年龄人口构成比为标准算得的标化 率为 P2,则:D A A. P2 = P1 B. P2 >P1 C. P2 <P1 D. P2 比 P1 要准确 E. P2 比 P1 要合理 6. 计算某年某地死亡率的分母是:E B A. 该地该年年初人口数 B. 该地该年年中人口数 C. 该地该年年末人口数 D. 该地该年任意时刻人口数 E. 以上都不是 7. óp 是描述 D A. 一个样本率对总体率的离散程度 B. 一些样本率之间的离散程度 C. 所有样本率之间的离散程度 D.所有含量相同的样本率之间的离散程度 E. 所有总体率之间的离散程度 8. 某医生用两种药物治疗两组同病患者,若治愈率相等,但甲组收治的病人数是 乙组的 10 倍,试比较两总体治愈率的 95%可信区间:A A. 甲组的较乙组的精密 B. 乙组的较甲组的精密 C. 甲组的较乙组的准确 D. 乙组的较甲组的准确 E. 以上都不是 9. 由样本估计总体率的 95%可信区间的计算公式 D A. π ±1.96 Sp C. π ±1.96 S X E. P±t 0.05(? )Sp42B. P±1.96 óp D. P±1.96 Sp 10. 用某药治疗某病患者,5 例中有 4 例治愈,宜写作 4/5,而不计算治愈率为 4/5×100%=80%,这是由于:E D A. 计算治愈率的方法不正确 B. 样本治愈率的可信区间太宽 C. 样本治愈率的可信区间太窄 D. 总体治愈率的可信区间太宽 E. 总体治愈率的可信区间太窄 11.计算相对数的目的是:B A 为了表示实际水平 B 为了便于比较 C 为了表明绝对水平 D 为了说明数据大小 E 为了进行显著性检验 12.相对数是表示:E A 计量资料相对大小的指标 B 表示平均水平的指标 C 表示事物关联程度的指标 D 表示排列等级的指标 E 计数资料相对水平的指标 13.对两个地区恶性肿瘤发病率进行标准化率的比较时,应该:D A A 排除两地人口年龄构成不同的影响 B 排除两地总人口数不同的影响 C 排除各年龄组死亡人数不同的影响 D 排除抽样误差 E 以上都不是 14.两地某病总死亡率比较时,进行标准化可以:C A 消除总人数不同的影响 B 消除各年龄组死亡率不同的影响 C 消除两比较组人口年龄构成不同的影响 D 消除两组调查时的抽样误差 E.消除以上各因素的影响 15.相对数中 E: A 发病率即为患病率 B 死亡率即为病死率 C 构成比即为相对比 D 总率即为标化率 E 相对比即为对比指标 16.300 例宫颈癌发病与年龄的关系:B E 年 龄 例 数 百分比 30 岁以下 33 11.00 31~ 95 31.66 41~ 131 43.67 51~60 41 13.67 合计 300 100.00 结论如下: A 41~以前随年龄增加发病率增加 B 宫颈癌发病率以 41~最高 C 41~以后随年龄增加而发病率下降 D 宫颈癌 30 岁以下最少见 E 以上全不对 17.下表为“锑剂短疗程治疗血吸虫病 51 例死亡病例临床分析”E 性别 <10 岁 10 ~ 20 ~ 30 ~ 40 ~ 50 ~ 计 女 3 11 4 5 1 5 29 男 3 7 6 3 2 1 22 合计 6 18 10 8 3 6 51 可认为: A 女性死亡率高于男性 B 10~死亡率最高 C 10~以后随年龄增加死亡率下降 D 例数过少,不能说明死亡率 E 是构成比,不能下率的结论43 18.某医院的资料,计算了各种疾病所占的比例,该指标为:A B A 发病率 B 构成比 C 相对比 D 标化发病率 E 标化发病比 19.男性吸烟率是女性的 10 倍,该指标为:A A 相对比 B 流行率 C 构成比 D 定基比 E 标化流行率 20.N 足够大,样本率不接近于 1 或 0,估计总体率 95%的可信区间用:A A P±1.96Sp B P±2.58Sp C P±1.96S D P±2.58S E P±2.33Sp 21. 相对比是 A.B 两个有关指标之比,两个指标要求:A C A 性质必须相同 B 性质必须不同 C 性质可以相同也可以不同 D 性质最好相同 E 以上都不是 22.若仅知道样本率,估计率的抽样误差用________指标表示 D。 A.S B. ? X C. S X D.Sp E.σ p五、 问答题:1. 常用的相对数指标有那些?它们的意义和计算上有何不同?为什么不能以比代率? 请联系实际加以说明。 2、应用相对数时应注意哪些问题? 3、什么情况下需要进行率的标准化?标准化的方法有那些六、 计算题1. 表 5-1(1)~(4)栏资料宜计算那些相对数指标?试 对围产儿在围产期死亡的主要因素作初步分析。 表 5-1 不同体重,孕周,产次的围产儿死亡情况分析

我要回帖

更多关于 春夏秋冬哪个季节最长 的文章

 

随机推荐