我16岁体重51公斤16岁身高体重170cm用KeeP软件条件会影响身体吗

当前位置: >>
SAS统计分析软件应用
SAS ― 统计分析系统Statistical Analysis System宁夏医科大学公共卫生学院 流行病与卫生统计学系 李吴萍 2011.51 第一节SAS软件简介1966年美国North Carolina州立大学的两位生物 统计学研究生开始研制SAS系统,直至1976年成立了 SAS软件研究所,正式推出了SAS软件,1985年推出 微机版SAS。SAS是用于决策支持的大型集成信息系统,软件 系统最早的功能限于统计分析,逐渐成为一个用来管 理、分析数据和编写报告的大型集成应用软件系统, 具有完备的数据访问、管理、分析、呈现及应用开发 等功能,完全超出了单纯统计应用的功能。属于世界 领先,使用最为广泛的统计软件之一。2 由于SAS系统是从大型机上的系统发展 而来,在设计上也是完全针对专业用户进行 设计,因此操作以SAS语言编程为主,另外 也有非编程方式的菜单系统,但人机对话的 界面不太友好。 学习SAS软件时,需要用户有基本的统 计学知识,对所选用的统计方法有较清楚的 了解,没有统计学基础知识要掌握SAS软件 较为困难。3 SAS系统是一个模块化的组合软件系统,它 提供了约20多个模块,各个模块之间既相互独立 又相互交融补充。本课程用得最多的是Base SAS 模块和SAS/STAT模块。 Base SAS是SAS系统的基础。它既可以单独 使用,也可以与其他模块组成一个用户化的SAS系 统,但是其他模块必须与之结合起来才能使用。 Base SAS主要承担着数据及用户使用环境的管理、 SAS语言程序的处理,并具有基本的数据分析和报 告等统计功能。4 SAS/STAT提供了当今流行的主要统计 分析方法,是国际上统计分析领域的标准权 威软件。它具有回归分析、方差分析、属性 数据分析、多元分析、聚类分析、判别分析、 非参数分析、生存分析和心理测量分析等统 计功能。5 第二节SAS软件的使用基础一、SAS的启动和退出 ? 启动SAS ? 双击桌面SAS图标 ? 开始菜单 程序 The Sas System The Sas System for Windows V*.* ? 直接双击SAS应用程序 ? 退出SAS ? 标题栏关闭按钮 ? 菜单栏 File Exit6 二、SAS的工作窗口标题栏、菜单栏、工具栏 ? Editor 程序编辑器窗口 ? LOG 运行过程日志窗口 ? Output 结果输出窗口 ? Explorer 资源管理器窗口 ? Results 结果索引窗口SAS常用功能键三个窗口间切换 F5 Editor F6 LOG F7 Output (程序) (日志) (结果)F4 Recall F8 Submit F1 Help F9 Keys(调回程序) (发送程序) (帮助) (功能键列表)7 第二节SAS软件的使用基础8 二、SAS的工作窗口?Editor窗口 主要用于打开SAS程序文件(*.sas)、编辑 和修改SAS程序、并提交全部或部分SAS程序。 LOG窗口 显示有关的SAS会话和提交SAS程序的信息, 包括程序的出错信息等(*.log)???Output窗口 主要显示提交SAS程序后的运行结果(*.lst)Explorer窗口 主要用于查看和管理所有SAS文件,而且 可以对非SAS文件创建快捷方式。 Results 窗口 主要用于操作和管理提交SAS程序后的输 出结果。他的内容与Output窗口的内容一一对应,可以?看成是Output窗口内容的名称。9 第三节一、SAS 语句SAS语言的语句和程序一个SAS语句就是要求SAS系统执行某种操作或给SAS系统提供一些信息的命令。SAS语句通常由SAS关键字、SAS名称、运算符及特殊字符组成。 规则: (1)以 ;结尾 (2)以SAS关键字开始。如: data,proc,input,cards,model,class,if,keep,set,run10 第三节一、SAS 语句SAS语言的语句和程序(3)注释语句可以用 * 开始,或者用/*…*/表示中间内容是注释语句。例1.1 Data sas1_1; /*sas1_1是数据集名*/ Input id name$ height weight@@; Bmi=weight/height**2; C /*数据流开始*/ 1 judy 1.56 45 2 lucy 1.67 53 3 lili 1.58 50 ; /*数据流结束*/ Proc print data=sas1_1; R11 第三节一、SAS 语句SAS语言的语句和程序1.SAS关键字 几乎所有的SAS语句都是由SAS关键字开始的,说明SAS语句的类型。data语句,input语句,proc语句, run语句2.SAS数据集名和变量名(1)32个字符之内, (2)第一个字母必须为字母或_;第二个以后可以为字母或 数字。 (3)字母不区分大小写。 (4)不能使用空格和%¥#$等特殊字符12 第三节一、SAS 语句SAS语言的语句和程序3.SAS运算符 包括比较运算、算术运算、逻辑运算(1)算数运算符 + - * / ** (2)比较运算符 = ^= & &= (3)逻辑运算符 and/& or/| Not/^ && && || 逻辑与 x&2 and y&3 逻辑或 x&2 or y&3 逻辑非 最大 3&&5;结果为5 最小 3&&5;结果为3 连接 A=?my name is?; B=?SAS?; C=A||B; 那么C=“my name is SAS”13&&= 第三节一、SAS 语句SAS语言的语句和程序4.SAS函数 函数的一般形式:函数名(自变量,自变量,…) (1)SAS常用的概率和密度函数 标准正态分布密度函数:probnorm(x) 如:y=probnorm(-1.96); 结果为0.025 t分布密度函数:probt(x,df) 如:y1= probt(0.95,100);结果为0.82780 F分布密度函数:probF(x,df1,df2) χ2分布密度函数:probCHI(x,df)二项分布概率函数:probBNML(p,n,m) 泊松分布概率函数:poisson(m,n)14 第三节SAS语言的语句和程序0≤p≤1正态分布分位数函数:probit(p) t分布分位数函数:TINV(p,df)如:y=probit (0.025), 结果为-1.96 F分布分位数函数:FINV(p,df1,df2)χ2分布分位数函数:CINV(p,df) 其它常用函数 ABS(x)-----取X的绝对值 SQRT(x)-----计算X的平方根 MOD(x,y)-----求x/y的余数15 第三节SAS语言的语句和程序EXP(x)----计算e的x次幂LOG(x)-----对自变量x求以e为底的自然对数LOG10(x)-----对自变量x求以10为底的对数CEIL(x)-----取≥自变量x的最小整数。 如CEIL(5.7)=6 FLOOR(x)-----取≤自变量x的最大整数。 如 CEIL(5.7)=5 INT(x)-----取X的整数部分 ROUND(x,n)----X按n的精度取舍入值16 第三节SAS语言的语句和程序data sas1_2; y1=probnorm(-1.96); /*标准正态分布密度函数*/ y2=probt(0.95,100); /* t分布密度函数*/ y3=probit(0.025); /*正态分布分位数函数*/ x1=log10(100); /*对自变量x求以10为底的对数*/ x2=exp(2); /*计算e的x次幂*/ x3=CEIL(5.7); /*取≥自变量x的最小整数*/ x4=ABS(-8); /*取X的绝对值*/ x5=SQRT(36); /*计算X的平方根*/ x6=MOD(10,3); /*求x/y的余数*/ x7=FLOOR(5.7); /*取≤自变量x的最大整数*/ x8=INT(5.6874); /*取X的整数部分*/ x9=ROUND(5.); /* X按n的精度取舍入值*/ A='my name is '; B='SAS'; C=A||B; proc print data=sas1_2;17 第三节二、SAS 程序SAS语言的语句和程序? 将一系列SAS语句按逻辑顺序排列起来,构成SAS程序。通常包括数据步和过程步两部分。 ? 数据步以data语句开头,以run语句结束。主要作用是 建立数据集。 ? 过程步以proc开头,以run语句结束。主要作用是激活SAS过程对数据进行处理和分析。? 提交SAS程序:(1)工具栏提交图标, (2)run/submit, (3)使用F3功能键18 第三节 二、SAS 程序SAS语言的语句和程序? 程序的储存:(1)键入“file ‘路径+文件名.扩展名” 如:file ‘d:\user\sas1-1.sas\’; (2)“文件”菜单―“保存” ? 程序的调用:(1)键入infile‘路径+文件名+扩展名’如:infile ‘d:\user\sas1-1.sas\’;(2)“文件”菜单―“打开”19 第三节data sas1_3;SAS语言的语句和程序例1.3 SAS程序举例/*创建名为sas1_3的SAS数据集*/Input id nam$ bmi=weight/height**2;1 Judy 1.56 45 2 Lucy 1.67 53 ; /*数据步结束*/ /*显示输出sas1_3数据集到output窗口*/ /*过程步结束*/ proc print data=sas1_3; /*数据流中每个数据值之间最少有1各空格*/20 第二章建立SAS数据集第一节 SAS数据集概述一、SAS数据集基本格式SAS数据集可以看做由若干行和若干列组成的表格, 一个数据集等价于关系型数据库中的一个表。变量变量有两种类型: 数值型变量 字符型变量观 测id 1 2 3 4name Judy Lucy Susan tonyheight 156 167 156 178weight 45 53 55 7021 第二章建立SAS数据集第一节 SAS数据集概述一、SAS数据集基本格式例2_1 缺失值的例子Data sas2_1; Input id name$ height weight@@; If name='999' then name=.; If weight=999 then weight=.; C 1 Judy 156 999 2 Lucy 167 58 3 999 165 55 4 Tomy 178 62 ; Proc print data=sas2_1;22 第二章建立SAS数据集二、临时SAS数据集和永久SAS数据集 临时数据集只能在SAS会话过程中创建使用,一旦退出SAS,数据集就不存在了。在Explorer窗口中可以看到一个名为work的SAS数据 库,主要存放SAS临时数据集。创建时可以用两水平 命名方式:如work.数据集名,也可以用一水平的命 名方式:如数据集名。23 第二章建立SAS数据集二、临时SAS数据集和永久SAS数据集 永久性数据集储存在硬盘里,因此,在以后的每一次SAS会话中都可以在打开。在创建和使用SAS永久性数据集之前,需要先建立一个SAS数据库来制定永久 数据集存放的路径。一个SAS数据库相当于硬盘上的 一个文件夹,可以将SAS数据集写入或读出。 命名永久性数据集时必须用两水平的命名方式,即数据库名.数据集名,数据库名实际是一个SAS数据库的逻辑名。24 第二章建立SAS数据集例2_2 SAS程序举例libname tj ?d:\user\?; /*创建名为tj的sas数据库*/ data tj.sas2_2; /*创建永久性数据集sas2_2,保存在‘d:\user? 下*/ Input id name$ bmi=weight/height**2; 1 Judy 1.56 45 2 Lucy 1.67 53 ; proc print data=tj.sas2_2; /*将保存在’d:\user?的数据 集sas2_2显示输出到output窗口*/25 第二章建立SAS数据集第二节 SAS数据集的建立一、用数据步创建SAS数据集创建SAS数据集最主要的方式是使用Base SAS中的数据步。 一个SAS数据步由data语句开始,后面接着其他程序语句,通过从原始数据文件中读入数据或对已存在的SAS数据集进行操作来建立新的SAS数据集。在SAS程序中,用户可以使 用不同的来源输入数据。常用的数据输入来源包括: (1)原始数据以数据流的方式; (2)原始数据以外部文件的方式; (3)已经存在的SAS数据集; (4)通过程序语句来建立数据集。26 1、从数据流中读入数据在SAS程序中,用cards语句定义数据流的开始。Input语句用于从数据流中读入数据。27 例2.3 从数据流读入数据建立数据集data sas2_3; 1 Judy 156 45 178 70 ; /*数据步结束*/ /*显示输出sas2_3数据集到output proc print data=sas2_3; 窗口*/ 2 Lucy 167 53 3 Susan 165 55 4 tony /*创建名为sas2_3的SAS数据集*/Input id name$ height weight@@;/*从数据流中读入数据*//*过程步结束*/28 2、从外部文件中读入数据Infile语句用来指定外部文件,通常外部文件并不是 SAS文件。用input语句将外部文件中的数据读入SAS中建立SAS数据集。外部文件中的记录可以按一个变量一列的方式排列,也可以没用格式,不安 列方式排列。29 例2.4 从外部文件读入数据 外部文本文件’k:\user\student.txt’1 Judy 1.56 45 2 Lucy 1.67 53 3 Susan 1.65 554 tony 1.78 70SAS程序: Data sas2_4;Infile ?d:\user\student.txt\?;R Proc print data=sas2_4; R/*指定外部文件*//*从外部文件中读取记录*/Input id name$30 3、从SAS数据集中读入数据运行set语句,SAS会从已有的SAS数据集中读入观用set语句可以从已有的SAS数据集中创建新的数据集。测,包括原始数据集中的所有变量,还可以在原数据集变量基础上创建新的变量。31 例2.5 从已有的SAS数据集中读入数据Data sas2_5; set sas2_4; R/*从已有的数据集sas2_4中读入数据*/Bmi=weight/height**2; Proc print data=sas2_5;R/*生成一个新变量*/32 4、利用程序语句建立SAS数据集 例2.6 利用程序语句建立SAS数据集Data sas2_6;Do i=1 to 10;O/*do与end语句之间的语句被重复执行10次*/Y=rannor(2008);E/*产生来自标准正态分布的随机数*/Proc print data=sas2_6;R33 二、Import/Export向导创建SAS数据集SAS中Import/Export向导可用于将其他类 型的文件,如Excel、Access、dBase、文 本文件等转为SAS数据集。在file菜单下点 击import/export,按向导指示操作即可。34 第三节SAS数据集的修改一、SAS数据集的合并1、按观测连接SAS数据集例2.7 按观测连接SAS数据集需要连接的SAS数据集female Id 1 2 3 name Judy Lucy Susan Sex female female female heigh weight t 156 167 165 45 53 5535male Id 4 5 name Tony Tom Sex male male height 178 170 weight 70 65 第三节 SAS数据集的修改使用set语句可以将两个或多个数据集按观测连成一 个大的数据集,这也是将新变量追加已有数据集上 的一种方式。例2.7 连接SAS数据集的例子Data sas2_7;Set tj.female tj. R Proc print data=sas2_7;R36 第三节 SAS数据集的修改2、按变量合并SAS数据集语句merge可以合并两个或多个数据集中的变量,这些数据集中的观测是一一对应的。 例2.8 一对一匹配合并SAS数据集需要连接的SAS数据集student1 Id 1 2 name Judy Lucy Sex female female Age 21 22 Id 1 2 student2 height 156 167 weight 45 533Susanfemale1931655537 第三节 SAS数据集的修改例2.8 按变量合并SAS数据集Data sas2_8;Merge student1 student2;RProc print data=sas2_8;R38 第三节 SAS数据集的修改如果需要合并的数据集中的观测并不是一一对应的关系,则需 要用by语句指定各数据集中用于匹配观测的变量。(使用by语 句之前,需要先对关键字段进行排序。 例2.9 利用程序语句建立SAS数据集 需要连接的SAS数据集student3 Id 1 2 3 name Judy Lucy Susan Sex female female female Age 21 22 19 1 2 4 5 student4 Id height 156 167 178 177 weight 45 53 70 6539 第三节SAS语言的语句和程序例2.9 按变量合并SAS数据集Proc sort data student3; Proc sort data student4;Data sas2_9;Merge student3 student4;RProc print data=sas2_9;R40 第三节1、删除观测SAS语言的语句和程序二、建立SAS数据集的哑集如果只想保留数据集中的部分观测,有两种 方式建立哑集。 第一种可以用if 条件语句告诉SAS需要保留 符合条件的观测;另一种用if…than delete语句告诉SAS将不符合条件的观测删除。41 第三节SAS语言的语句和程序例2.10 删除观测的例子studentId 1 2name Judy LucySex female femaleAge 21 22height 156 167weight 45 5334 5SusanTony TomfemaleMale male1923 25165178 1775570 6542 第三节 例2.10 程序1Data sas2_10;SSAS语言的语句和程序If sex=?female?;RProc print data=sas2_10;R43 第三节 例2.10 程序2Data sas2_10;SSAS语言的语句和程序If sex=?female?RProc print data=sas2_10;R44 第三节2、删除变量SAS语言的语句和程序有时并不需要数据集中的所有变量,可以 用drop或keep语句来删除或保留数据集 中的变量,注意同一个数据步中drop和 keep语句不能同时出现。45 第三节SAS语言的语句和程序删除变量的例子,仅保留数据集student中的部分变量 (id,name,sex,age)。可以用下面两个SAS程序。例2.11 程序1Data sas2_11;SK R Proc print data=sas2_11;R46 第三节例2.11 程序2Data sas2_11;SSAS语言的语句和程序DR Proc print data=sas2_11;R47 第三章常用统计描述7.42 23.02 21.61 21.31 21.46 9.97 22.73 14.94 20.18 21.62 例 3.18.65 抽样调查某地 120名 18― 35 岁健康男性居民血 23.07 20.38 8.40 17.32 29.64 19.69 21.69 23.90 17.45 19.08 清铁含量( μmol/L ),数据如下。试编制此血清铁资 20.52 24.14 23.77 18.36 23.04 24.22 24.13 21.53 11.09 18.89 料的频数分布表并描述该资料。 18.26 23.29 17.67 15.38 18.61 14.27 17.40 22.55 17.55 16.10 17.98 20.13 21.00 14.56 19.89 19.82 17.48 14.89 18.37 19.50 17.08 18.12 26.02 11.34 13.81 10.25 15.94 15.83 18.54 24.52 19.26 26.13 16.99 18.89 18.46 20.87 17.51 13.12 11.75 17.40 21.36 17.14 13.77 12.50 20.40 20.30 19.38 23.11 12.67 23.02 24.36 25.61 19.53 14.77 14.37 24.75 12.73 17.25 19.09 16.79 17.19 19.32 19.59 19.12 15.31 21.75 19.47 15.51 10.86 27.81 21.65 16.32 20.75 22.11 13.17 17.55 19.26 12.65 18.48 19.83 23.12 19.22 19.22 16.72 27.90 11.74 24.66 14.18 16.5248 第三章1、定量资料的频数表?常用统计描述一、定量资料的统计描述先用MEANS过程找出最大值和最小值 MIN=7.42 MAX=29.64 RANGE=22.22 确定组距(I=2)和第一组段的下限(L=7) 然后建立新变量(x0),将变量X转化为该数据所在组段的下限值? ?赋值新的变量:x0=INT((X-L)/I)*I+L 或:x0=x-mod(x-L,I) 或:x0=I*INT(x/I)+I/2用FREQ过程作频数表: tables x0; R?49 第三章常用统计描述2、简单描述:MEANS过程 输出样本含量、均数、标准差、最小值、最大值 ( N、Mean、Std Dev、Minimum、Maximum) 3、详细描述:UNIVARIATE过程输出更多指标:样本含量、均数、标准差、最小值、最大值、 方差、标准误 、中位数、四分位数间距、常用百分位数、 众数、平方和、离均差平方和等,可以作正态性检验 另外还显示原数据中的部分极端值50 第三章常用统计描述PROC MEANS; CLASS SEX; VAR HEIGHT WEIGHT; RUN;CLASS 指定分组变量(可以不写) VAR 指定需要分析的变量(不写即分析全部变量) MAXDEC=n 指定计算结果保留小数位数(默认2位)可加的选项有:标准误(StdErr)、方差(Var)、总和(Sum)、平方 和(USS)、离均差平方和(CSS)、全距(Range)、变异系数 (CV)、偏度系数(Skewness)、峰度系数(Kurtosis)、可信区间 (CLM)等 还可以计算总体均数=0的 t 检验(T、Prt)不加任何选项时,自动输出5项结果: N、Mean、Std Dev、Minimum、Maximum51 第三章Data sas3_1;Input x@@; Gr=2;常用统计描述x0=gr*int(x/gr)+gr/2; /*计算组中值X0*/ C 7.42 8.65 23.02 21.61…24.66 14.18 16.52 ;proc freq data=sas3_1; Tables x0/out= /*out=iron表示输出变量为X0的一维频数分布表*/Proc univariate data =sas3_1;VHistogram x/midpoints=7 to 29 by 2; /*组中值的取值范围从7―29,组距为2*/ R Proc means data=sas3_1;VR52 第三章常用统计描述例3.2随机抽取15名学生,记录他们的性别(sex)、年龄 (age)、体重(w,kg)、和身高(h,cm),求:(1)按性别分组分别计算学生们身高和体重的均数、标准差、变异系数、中位数和P50。 (2)计算学生身高95%可信区间。要求结果保留小数点后3位。F 15 46 156 f 14 41 149 f 18 65 165 m 15 50 160 m 13 48 155 m 18 70 180 m 14 38 150 m 16 55 165 m 17 68 176 m 16 60 170 f 17 50 160 f 17 58 160 f 16 60 165 m 17 65 175 f 18 61 16253 Data sas3_2;Input sex$ age w h @@;C f 15 46 156 f 14 41 149 f 18 65 165 m 15 50 160 m 13 48 155m 18 70 180 m 14 38 150 m 16 55 165 m 17 68 176 m 16 60170 f 17 50 160 f 17 58 160 f 16 60 165 m 17 65 175 f 18 61 162;Proc means data=sas3_2 mean std cv median p50 clm maxdec=3; /*选项maxdec指小数点后保留的位数*/VC R54 第三章常用统计描述例3.3 对40名麻疹易感儿童接种麻疹疫苗一个月后, 测得其血凝抑制抗体滴度如下,求其平均滴度。55 Data sas3_3; /*计算几何均数*/ Input f x @@;Y=log10(x);C 1 4 5 8 6 16 2 32 7 64 10 128 4 256 5 512 ;P /*选项noprint表示不打印程序运行结果*/V F Output out=b mean= /*选项out=b和mean=my表示把该过程步运行所得均数叫my,并放入数据集b中*/D S mx=10**Proc print data=c;V R56 第三章常用统计描述二、定性资料统计描述FREQ 过程 可以产生频数表和 n 维列联表 PROC FREQ;TABLES A ;RUN;TABLES 指定要分析的定性变量TABLES A TABLES A*B 产生一维频数表 产生二维列联表(A是行B是列)TABLES A*B*C 产生三维列联表 (A是分层,B是行,C是列)TABLES A*(B C) 产生A*B、A*C两个二维表 TABLES X1-X3 产生X1、X2、X3三个一维表57TABLES (X1-X4)*Y 产生X1*Y X2*Y X3*Y X4*Y四个二维表 如描述以下三个定性变量(258人) A文化程度(1=文盲2=初中以下3=高中4=大学) B工作强度(1=轻 2=中 3=重) C月收入 (1=&300 2=300- 3=500- 4=1000-)DATA SAS3_4; INPUT A B C@@; CARDS; 3 2 3 4 1 4 4 1 3…… ; PROC FREQ; TABLES A B C; PROC FREQ; TABLES A*B; PROC FREQ; TABLES A*B*C; PROC FREQ; TABLES A*(B C); RUN;58 一维频数表 Cumulative Cumulative A Frequency Percent Frequency Percent 频数 构成比 累计频数 累计构成比 2 78 30.2 78 30.2 3 85 32.9 163 63.2 4 95 36.8 258 100.059 二维频数表频数 Frequency| 构成比 Percent | C 行构成比 Row Pct | 列构成比 Col Pct | 1 | 2 | 3 | 4 | Total ---------+--------+---------+---------+--------+--------+ 1 | 0 | 6| 37 | 26 | 69 B | 0.00 | 6.32 | 38.95 | 27.37 | 72.63 | 0.00 | 8.70 | 53.62 | 37.68 | | . | 75.00 | 67.27 | 81.25 | ---------+--------+---------+---------+--------+--------+ 2 | 0 | 2| 18 | 6 | 26 | 0.00 | 2.11 | 18.95 | 6.32 | 27.37 | 0.00 | 7.69 | 69.23 | 23.08 | | . | 25.00 | 32.73 | 18.75 | ---------+--------+---------+---------+--------+--------+ Total 0 8 55 32 95 0.00 8.42 57.89 33.68 100.0060A=4 第四章一、单样本的t检验t 检验例4-1 以往新生儿出生体重平均为3000g,某医院 对产妇开展孕期保健指导后,测得15名新生儿出 生体重如下,问开展孕期保健指导后对新生儿体 重是否有影响? 00 00 00 50 320061 第四章一、单样本资料的t检验t 检验SAS常用于t检验的过程有: PROC UNIVARIATE过程 PROC MEANS过程 PROC TTEST过程(本章重点讲述)62 第四章一、单样本资料的t检验t 检验DATA SAS4_1; INPUT X@@; 00 00 50 00 00 ; RUN; PROC VAR X; RUN; Proc ttest h0=3000; VAR X; RUN;63 第四章t 检验例4-2 本例是有关儿童阅读能力测试的比较,数据来自 Moore(1995,)的研究。数据包含了44名三年级儿童的阅读 能力评分(DRP),具体见表。请问这些儿童阅读能力评分是 否高于一般儿童的评分(30分)?44名儿童阅读能力评分评分 频数 40 2 47 2 52 2 26 1 19 2 25 2 35 4 39 1 26 1 41 2评分频数 评分481 51142 43221 27421 46342 28332 49181 31151 28291 54441 45频数112211111164 第四章/*对频数分布资料的分析*/t 检验Data sas4_2; Input x f@@; C 40 2 47 2 52 2 26 1 19 2 25 2 35 4 39 1 26 1 48 1 14 2 22 1 42 1 34 2 33 2 18 1 15 1 29 1 41 2 44 1 51 1 43 1 27 2 46 2 28 1 49 1 31 1 28 1 54 1 45 1 ; R PROC VAR X; F RUN; Proc ttest h0=30; VAR X; F RUN;65 二、配对设计 t 检验例4-3 为了比较新旧两个测声计的测定效果,随机 选定10个场地,在每地同时用新旧两个测声计测量 数据如下,问新旧两个测声计的测量结果是否不同? 场地 1 2 3 4 5 6 7 8 9 10 旧: 87 65 74 95 65 55 63 88 61 54 新: 86 66 77 95 60 53 62 85 59 5566 第四章Data sas4_3; Input x1 x2@@; D=x1-x2; C87 86 65 66 74 77 95 95 65 60 55 53 63 62 88 85 61 59 54 55t 检验; R PROC VAR RUN; P Paired x1*x2; RUN;Proc ttest h0=0; VAR RUN;67 三、两独立样本资料的t检验例4-4 试比较克山病人与健康人的血磷值(mmol/L) 是否不同? 克山病人 0.84 1.67 健康人 0.54 1.16 1.87 1.05 1.80 0.64 1.20 1.20 1.87 0.64 1.34 1.20 2.07 0.75 1.35 1.39 1.53 2.11 0.76 0.81 1.48 1.5668 两样本均数比较用TTEST过程(方式一)DATA sas4_4; INPUT X@@; IF _N_&11 THEN G=2; ELSE G=1; CARDS;0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.072.11 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87 ; PROC TTEST; CLASS G; VAR X; RUN;69 两样本均数比较用TTEST过程(方式二)DATA sas4_4; INPUT X g@@; CARDS; 0.84 1 1.05 1 1.20 1 1.20 1 1.39 1 1.53 1 1.67 1 1.80 1 1.87 1 2.07 1 2.11 1 0.54 2 0.64 2 0.64 2 0.75 2 0.76 2 0.81 2 1.16 2 1.20 2 1.34 2 1.35 2 1.48 2 1.56 2 1.87 2 ; PROC TTEST; CLASS VAR X; RUN;70 结果:Variable GX 1 X X 2 Diff (1-2) 11 1.9 -0.795 -0.436 T-Tests Variable X X Method Pooled Satterthwaite Variances Equal Unequal DF 22 21.4 t Value -2.52 -2.52 Pr & |t| 0.6 1. 0.8 0. 0.2 0.9 Statistics Lower CL Upper CL Lower CL Upper CL N Mean Mean Mean Std Dev Std Dev Std Dev Std Err 13 0.6 1.7 0.9 0.1171Equality of Variances Variable X Method Folded F Num DF 12 Den DF 10 F Value 1.00 Pr & F 1.000071 (方式三)两大样本均数比较时,如只有均数标准差,而无原始 数据时,无法直接调用SAS软件中的某个过程进行分 析,只能在数据步中按照计算公式编写程序完成。调查健康人群红细胞数 (1012/L)资料如下:男性360人,均数466.02,标准差57.46;女性255人,均数417.80,标准差29.10。试比较男女红细胞数有无差别?72 (方式三)DATA BB; INPUT N1 X1 S1 N2 X2 S2; SE=SQRT(S1*S1/N1+S2*S2/N2); U=ABS(X1-X2)/SE; P1=1-PROBNORM(U); P=2*P1; U=ROUND(U,0.001); P=ROUND(P,0.00001); IF P&0.0001 THEN P=0.0001; CARDS; 360 466.02 57.46 255 417.80 29.10; RUN; var x1 x273 第五章方差分析SAS中常用PORC ANOVA过程和PORC GLM过程来完成方差分析。其中, ANOVA过程只能用于平衡设计资料的方差分析;对样本容量不等(非均衡)的数据资料做方差分析时,应采用GLM过程。应当说明的是,对样本容量相等的数据资料,用 ANOVA过程作方差分析的效率和可靠性等方面,都优 于GLM过程。对平衡数据用GLM过程处理和用 ANOVA过程处理的结论是一致的。74 第五章包括:简单回归(一元回归)方差分析GLM是数据分析过程中功能最丰富的一个过程她 加权回归多重回归及多元回归方差分析 协方差分析 反应面模型分析多项式回归偏相关分析 多元方差分析 重复测量方差分析75 第五章方差分析一、完全随机设计资料的方差分析(一)各组例数相等的完全随机设计资料的方差分析例5-1 某医生为了研究一种降血脂新药的临床疗效,按统一纳 入标准选择120名高血脂患者,采用完全随机设计方法将患者 等分为4组,进行双盲试验。6周后测得低密度脂蛋白作为实验结果,问4个处理组患者的低密度脂蛋白含量总体均数有无差别?76 第五章方差分析data sas5_1; /*研究生二版ex4-2例题*/ input x c @@; 3.53 1 2.42 2 2.86 3 0.89 4.59 1 3.36 2 2.28 3 1.06 …… ; Pr model x=c; means c/ means c/4 477 第五章data sas5_1;do c=1 to 4; do j=1 to 30; input x @@;方差分析/*研究生二版ex4-2例题*/ 3.53 2.42 2.86 0.89 4.59 3.36 2.28 1.06…… ;Pr model x=c; means c/ means c/78 第五章方差分析(二)各组例数不等的完全随机设计资料的方差分析例5-2 某机构研究婴儿出生体重与母亲生育年龄的关系,所得 资料见表,试问婴儿出生体重是否受母亲生育年龄的影响?(设资料服从正态分布且总体方差齐性)不同母亲生育年龄的婴儿出生体重母亲生 育年龄婴儿出生体重(kg)3.5 3.2 3.1 4.0 3.4 2.7 3.2 2.9 2.9 3.3 2.5 2.9 2.9 2.8 2.8 2.5 3.5 2.4 3.2 3.3 3.3202530-79 (二)各组例数不等的完全随机设计资料的方差分析data sas5_2;do g=1 to 3; do j=1 input x @@; 8 3.5 4.0 3.2 3.3 2.9 2.5 3.2 3.3 7 3.2 3.4 2.9 2.5 2.8 3.5 3.3 6 3.1 2.7 2.9 2.9 2.8 2.4 ; model x=g; means g/ means g/80 第五章方差分析二、随机区组设计资料的方差分析例5-3 某研究者采用随机区组设计进行实验,比较三种抗癌药 物对小白鼠肉瘤抑瘤效果,先将15只染有肉瘤小白鼠按体重大 小配成5个区组,每个区组内3只小白鼠随机接受三种抗癌药物 (具体分配结果见例4-3),以肉瘤的重量为指标,试验结果 见表4-9。问三种不同的药物的抑瘤效果有无差别?81 第五章data sas5_3; input x a b @@;0.82 0.73 0.43 0.41 0.68 ; 1 1 1 1 1 1 0.65 2 0.54 3 0.34 4 0.21 5 0.43 2 2 2 2 2 1 0.51 2 0.23 3 0.28 4 0.31 5 0.24 3 3 3 3 3方差分析二、随机区组设计资料的方差分析(方法一)1 2 3 4 5proc GLM; model x= means a/ means b/82 第五章data sas5_3;do a=1 to 3; do b=1 to 5; input x @@;方差分析二、随机区组设计资料的方差分析(方法二)0.82 0.73 0.43 0.41 0.68 0.65 0.54 0.34 0.21 0.43 0.51 0.23 0.28 0.31 0.24; proc GLM; model x= means a/ means b/83 第五章方差分析三、拉丁方设计资料的方差分析(方法一)注射部位编号(列区组) 家兔编号 例 5-4 比较A、B、C、D 、E、F 6种药物给家兔注射(行区组)1 2 3 ),研究者选用 4 5 6只家兔、 6 后产生的皮肤疱疹大小( mm2 1 C(87) B(75) E(81) D(75) A(84) F(66) 并在每只家兔的 6个不同部位进行注射。 试验结果见表4-11,试做拉丁方设计和方差分析。3 4 5 6 F(73) A(77) D(64) E(75) E(73) F(68) C(64) D(77) B(74) C(69) F(72) A(82)2B(73)A(81)D(87)C(85)A(78) B(74) E(76) F(61)F(64)D(73) E(76) B(70) C(82)E(79)C(77) D(73) A(81) B(61)84 第五章方差分析三、拉丁方设计资料的方差分析(方法一)data saa5_4; input r c z $ x@@; 1 1 C 87 1 2 B 75 1 3 E 81 1 4 D 75 1 5 A 84 1 6 F 66 2 1 B 73 2 2 A 81 2 3 D 87 2 4 C 85 2 5 F 64 2 6 E 79 3 1 F 73 3 2 E 73 3 3 B 74 3 4 A 78 3 5 D 73 3 6 C 77 4 1 A 77 4 2 F 68 4 3 C 69 4 4 B 74 4 5 E 76 4 6 D 73 5 1 D 64 5 2 C 64 5 3 F 72 5 4 E 76 5 5 B 70 5 6 A 81 6 1 E 75 6 2 D 77 6 3 A 82 6 4 F 61 6 5 C 82 6 6 B 61 ; model x= means z/85 第五章data sas5_4; do c=1 to 6; do r=1 to 6; input z $ C 87 B 75 E B 73 A 81 D F 73 E 73 B A 77 F 68 C D 64 C 64 F E 75 D 77 A ; model x=方差分析三、拉丁方设计资料的方差分析(方法二)81 87 74 69 72 82D C A B E F75 85 78 74 76 61A F D E B C84 64 73 76 70 82F E C D A B66 79 77 73 81 6186 第五章外膜缝合(ai, i=1) 1个月方差分析束膜缝合(ai, i=2) 1个月四、析因设计资料的方差分析 例5-5 将20只家兔随机等分4组,每组5只,进行神经 损伤后的缝合试验。处理由两个因素组合而成,A因素2个月 2个月为缝合方法,有两个水平,B因素为缝合后的时间,有 10 30 10 50 两个水平。实验结果为家兔神经缝合后的轴突通过率10 30 20 50 %,见表,试比较不同缝合方法及缝合后时间对轴突 40 70 30 70 通过率的影响,及有无交互作用?(bi, j=1)(bi, j=2)(bi, j=1)(bi, j=2)501060305030603087 第五章data sas5_5; input x a b @@; 10 1 1 10 30 1 2 30 10 2 1 20 50 2 2 50 ; model x=a b a*b; lsmeans a*b/方差分析四、析因设计资料的方差分析(方法一)1 1 2 21 2 1 240 70 30 701 1 2 21 2 1 250 60 50 601 1 2 21 2 1 210 30 30 301 1 2 21 2 1 288 第五章方差分析四、析因设计资料的方差分析(方法二)data sas5_5; do a=1 to 2; do b=1 to 2; do i=1 to 5 input x@@; 10 10 40 50 10 30 30 70 60 30 10 20 30 50 30 50 50 70 60 30 ; model x=a b a*b;89 第五章方差分析五、重复测量资料的方差分析(方法二) T0 T1 T2 T3 T4 g例5-6 将手术要求基本相同的 15名患者随机分 120 108 112 120 117 3组,在手术过程 1 118 109 115 126 123 1 中分别采用A,B ,C三种麻醉诱导方法,在 T0(诱导前) T1、 119 112 119 124 118 1 T2、T3、T4五个时相测量患者的收缩压,数据记录见表,试进 121 112 119 126 120 1 行重复测量分析。127 121 122 128 117 118 131 129 123 123 125 121 120 121 129 115 114 119 128 123 121 124 127 118 119 126 111 116 118 121 120 116 118 133 131 129 135 123 123 135 148 143 145 142 126 137 133 142 131 133 129 132 136 126 130 1 2 2 2 2 2 3 3 3 3 390 第五章方差分析五、重复测量资料的方差分析data sas5_6; input t0-t4 g@@; 120 108 112 120 117 1 118 109 115 126 123 1 …… ; model t0-t4=g; repeated time 5/ /*选项printe用于对数据进行球形检验*/91 第六章χ2 检验常用于两种不同的用法,一方面,拟合优度检验指根据样本的频数分布检验其总体分布是否吻合于假定的分布,常见的是两个或多个率或构成比的比较。二方面, χ2关联性分析是指一份随机样本按两种属性分类,分析其个体来自第一个变量某类别的概率与来自第二个变量某类别的概率是否有关。χ2检验用FREQ过程加CHISQ选项92 第一节 两独立样本资料的χ2 检验一、二分类情形――2×2列联表(四格表) 例6-1 某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组)降低颅内压的疗效。将200例颅内压增高症患者随机分为两组,结果见表7-1。问两组降低颅内压的 总体有效率有无差别?组 别 试验组 对照组 合 计 有效 99(90.48) 75(83.52) 174 无效 5(13.52) 21(12.48) 26 合计 104 96 200 有效率(%) 95.20 78.13 87.0093 DATA sas6_1; DO r=1 TO 2; DO c=1 TO 2; INPUT F@@; OUTPUT; END; END; CARDS; 99 5 75 21 ; PROC FREQ; TABLES r*c/CHISQ; WEIGHT F; RUN;94 data sas6_1; input r c f @@; 1 1 99 12 5 2 1 75 2 2 21 ; tables r*c/95 WEIGHT 语句指明变量 F 是频数选项 EXACT可以对&2×2表作Fisher确切概率EXPECTED可以显示每个格子的理论值CMH可以计算队列研究和病例对照研究的RR值NOROW、NOCOL、NOPERCENT 不显示相应百分数NOPRINT 不显示表格,只显示计算的统计量96 四格表确切概率法例6-2 某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为 预防注射组和非预防组,结果见表7-4。问两组新生 儿的HBV总体感染率有无差别?组别 预防注射组 非预防组 合计 阳性 阴性 4 5(3) 9 18 6 24 合计 22 11 33 感染率 (%) 18.18 45.45 27.2797 第六章data sas6_2; input r c f @@; 11 4 1 2 18 21 5 22 6 ; tables r*c/χ2 检验98 第六章二、配对四格表的χ2 检验χ2 检验例6-3 某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗核抗体进行测定,结果见表7-3。问两种方法的检测结果有无差别? 免疫荧光法 + - 合计 乳胶凝集法 + 11(a) 2(c) 13 - 12(b) 33(d) 45 合计 23 35 5899 第六章χ2 检验二、配对四格表的χ2 检验(方法一:适合b+c&40)data sas6_3; input r c f @@; 1 1 11 1 2 12 21 2 2 2 33 ; tables r*c/Tables r*c/agree对列联表作 MCNemar检验和 一致性检验100 第六章χ2 检验二、配对四格表的χ2 检验(方法二)DATA INPUT f11 f12 f21 f22; IF f12+f21&40 THEN chisq=(ABS(f12-f21)-1)**2/(f12+f21); ELSE chisq=ABS(f12-f21)**2/(f12+f21); p=1-PROBCHI(chisq,1); CARDS; 11 12 2 33 ; PROC PRINT data=b; RUN;101 三、R×C 列联表的χ2 检验 例6-4 某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见表7-8。问三种疗法的有效率有无差别?三种疗法有效率的比较疗法 物理疗法组 药物治疗组 外用膏药组 合计 有效 199 164 118 481 无效 7 18 26 51 合计 206 182 144 532 有效率(%) 96.60 90.11 81.94 90.41102 第六章χ2 检验三、R×C 列联表的χ2 检验data sas6_4; input r c f @@; 1 1 199 12 7 2 1 164 2 2 18 3 1 118 3 2 26 指定精确概率 ; tables r*c/103 例 6-5 测得某地5801人的ABO血型和MN血型结果如表,问两种血型系统之间是否有关联?某地5801人的血型ABO血型M 431 388 495137 1451MN血型 NMN 902 800 95032 2684合计O A BAB 合计490 410 587179 166632348 5801104(单样本,做关联性检验) data sas6_5; input r c f @@; 1 1 431 1 2 490 1 3 902 2 1 388 2 2 410 2 3 800 3 1 495 3 2 587 3 3 950 4 1 137 4 2 179 4 3 32 ; tables r*c/105 第七章基于秩次的非参数统计一、配对样本比较的符号秩和检验 例7-1 对12份血清分别用原方法(检测时间20分钟) 和新方法(检测时间10分钟)测谷-丙转氨酶,结果见表8-1的(2)、(3)栏。问两法所得结果有无差别?原法 新法 原法60 76 190142 152 25195 243 19880 82 38242 240 236220 220 95新法2053824344190100106 第七章基于秩次的非参数统计data sas7_1; input x1 x2 @@; d=x1-x2; 60 76 142 152 195 243 80 82 242 240 220 220 190 205 25 38 198 243 38 44 236 190 95 100 ; proc univariate normal muo=0;107 第七章基于秩次的非参数统计二、两独立样本比较的Wilcoxon秩和检验原始数据两独立样本比较例7-2 对10例肺癌病人和12例矽肺0期工人用X光片测量肺门横径右侧距RD值(cm),结果见表8-5。问肺癌病人的RD值是否高于矽肺0期工人的RD值?肺癌病人矽肺0期工人2.78 3.23 4.20 4.87 5.12 6.21 3.23 3.50 4.04 4.15 4.28 4.34肺癌病人矽肺0期工人7.18 8.05 8.56 9.604.64 4.75 4.82 4.95 5.10 4.47108 第七章基于秩次的非参数统计二、两独立样本比较的Wilcoxon秩和检验data sas7_2; input x c @@; 2.78 1 3.23 1…… ; proc npar1109 第七章基于秩次的非参数统计二、两独立样本比较的Wilcoxon秩和检验 频数表两独立样本比较例7-3 39名吸烟工人和40名不吸烟工人的碳氧血红蛋白HbCO(%)含 量见表8-6。问吸烟工人的HbCO(%)含量是否高于不吸烟工人的 HbCO(%)含量?含量 (1) 很低 低 中 偏高 高 合计 吸烟 工人 (2) 1 8 16 10 4 不吸烟 合计 工人 (3) 2 23 11 4 0 (4) 3 31 27 14 4 秩范围 (5) 1~3 4~34 35~61 62~75 76~79 平均秩 (6) 2 19 48 68.5 77.5 秩 和 吸烟工人 不吸烟工 人 (7)=(2)(6) (8)=(3)(6) 2 4 152 437 768 685 310 528 274 039(n1)40(n2)79──1917(T1)1243(T2)110 第七章基于秩次的非参数统计data sas7_3; 11 1 12 8 1 3 16 1 4 10 15 4 21 2 2 2 23 2 3 11 24 4 25 0 ; proc npar1111 第七章基于秩次的非参数统计三、多个独立样本比较的Kruskal-Wallis H 检验原始数据的多个样本比较例7-4 用三种药物杀灭钉螺,每批用200只活钉螺,用药后清点每批钉螺 的死亡数、再计算死亡率(%),结果见表8-9。问三种药物杀灭钉螺的效 果有无差别?甲药 死亡率 32.5 35.5 40.5 46.0 秩 10 11 13 14 16.0 20.5 22.5 29.0 乙药 死亡率 秩 4 6 7 9 6.5 9.0 12.5 18.0 丙药 死亡率 秩 1 2 3 549.0Ri ni1563 536.0─ ─1238 524.0─ ─819 5112 data sas7-4; input x c @@; 32.5 1 16.0 2 6.5 3 35.5 1 20.5 2 9.0 3 40.5 1 22.5 2 12.5 3 46.0 1 29.0 2 18.0 3 49.0 1 36.0 2 24.0 3 ; proc npar1113 第七章基于秩次的非参数统计三、多个独立样本比较的Kruskal-Wallis H 检验频数表资料和等级资料的多个样本比较 例7-5 四种疾病患者痰液内嗜酸性白细胞的检查结果见表 8-11。问四种疾 支气管 病毒性呼 白细胞 肺水肿 肺癌 合计 秩范围 平均秩 病患者痰液内的嗜酸性白细胞有无差别?⑴ + ++ +++ Rini Ri扩张 ⑵ 0 2 9 6 739.5 17 43.50⑶ 3 5 5 2 436.5 15 29.10⑷ 5 7 3 2 409.5 17 24.09吸道感染 ⑸ 3 5 3 0 244.5 11 22.23⑹ ⑺ 11 1~11 19 12~30 20 31~50 10 51~60 ─ 60 ─ ─ ─ ─⑻ 6 21 40.5 55.5 ─ ─ ─114 data sas7_5; 110 122 139 146 213 225 235 242 315 327 333 342 413 425 433 440 ; proc npar1115 第七章受试号基于秩次的非参数统计频率 C 频率 D三、随机区组设计多个样本比较的Friedman M检验频数表资料和等级资料的多个样本比较 频率 A 频率 B例7-6 8名受试对象在相同实验条件下分别接受 种不同频率 反应率 秩 反应率 秩 反应率 秩 4反应率 秩 声音的刺激,他们的反应率( %)资料见表 8-12。问 4种频率 1 8.4 1 9.6 2 9.8 3 11.7 4 声音刺激的反应率是否有差别?2 3 4 5 6 7 8 11.6 1 2 2 2 1 1 1 11 12.7 4 1 1 1 3 2 2 16 11.8 2 4 3 3.5 2 3 3 23.5 12.0 12.0 8.6 10.6 11.4 10.8 ─ 3 3 4 3.5 4 4 4 29.51169.4 9.8 8.3 8.6 8.9 7.8 ─9.1 8.7 8.0 9.8 9.0 8.2 ─10.4 9.9 8.6 9.6 10.6 8.5 ─9.8Ri 第七章基于秩次的非参数统计三、随机区组设计多个样本比较的Friedman M检验频数表资料和等级资料的多个样本比较data sas7-6; input x a b @@;/*x为分析变量,a为处理组变量,b为区组变量*/ 8.4 1 1 9.6 2 1 9.8 3 1 11.7 4 1 11.6 1 2 12.7 2 2 11.8 3 2 12.0 4 2 9.4 1 3 9.1 2 3 10.4 3 3 9.8 4 3 9.8 1 4 8.7 2 4 9.9 3 4 12.0 4 4 8.3 1 5 8.0 2 5 8.6 3 5 8.6 4 5 8.6 1 6 9.8 2 6 9.6 3 6 10.6 4 6 8.9 1 7 9.0 2 7 10.6 3 7 11.4 4 7 7.8 1 8 8.2 2 8 8.5 3 8 10.8 4 8 ; tables b*a*x /*作列联表*/ /scores=rank /*对x进行排序*/ cmh2; /*进行friedman检验*/117 第七章基于秩次的非参数统计data sas7-6; 三、随机区组设计多个样本比较的 Friedman M检验 input x a b @@; 频数表资料和等级资料的多个样本比较 8.4 1 1 9.6 2 1 9.8 3 1 11.7 4 1 11.6 1 2 12.7 2 2 11.8 3 2 12.0 4 2 9.4 1 3 9.1 2 3 10.4 3 3 9.8 4 3 9.8 1 4 8.7 2 4 9.9 3 4 12.0 4 4 8.3 1 5 8.0 2 5 8.6 3 5 8.6 4 5 8.6 1 6 9.8 2 6 9.6 3 6 10.6 4 6 8.9 1 7 9.0 2 7 10.6 3 7 11.4 4 7 7.8 1 8 8.2 2 8 8.5 3 8 10.8 4 8 ; proc rank out= /*调用排序过程对变量x编秩次,秩次数据输出到数据集aa中*/ /*指定秩次变量名为rx*/ proc anova data= /*调用anova过程,对秩次进行方差分析*/ model rx=118 第八章线性相关与回归一、直线相关与回归 例9-1 某地方病研究所调查了8名正常儿童的尿肌酐 含量(mmol/24h)如表9-1。绘制散点图,进行相关 分析,估计尿肌酐含量(Y)对其年龄(X)的回归 方程。表9-1 8名正常儿童的年龄 (岁)与尿肌酐含量 (mmol/24h) 编号 1 2 3 4 5 6 7 8年龄X131196810127尿肌酐含量Y 3.54 3.01 3.09 2.48 2.56 3.36 3.18 2.65119 第八章线性相关与回归data sas8_1; input x y@@; 13 3.54 11 3.01 9 3.09 6 2.48 8 2.56 10 3.36 12 3.18 7 2.65; /*制作散点图*/ plot y*x; /*进行相关分析*/ /*进行回归分析*/ model y=x/ /*clm为输出y总体均数95%置信区间,cli为输出y个 体预测值95%预测区间,clb为输出回归系数95%的置信区间*/ plot y*x/ /*输出y关于x的散点图,并拟合回归线,conf为输出y总 体均数的置信带,pred为输出y个体值的预测带*/ plot STUDENT.*y; /*标准化残差为纵坐标,应变量y为横坐标的标准化残差 图*/120 第八章线性相关与回归二、Spearman秩相关例9-8 某省调查了1995年到1999年当地居民18类死因 的构成以及每种死因导致的潜在工作损失年数WYPLL 的构成,结果见表9-3。以死因构成为X,WYPLL构成 为Y,作等级相关分析。121 data sas8_2; 0.03 0.05 0.14 0.34 0.20 0.93 0.43 0.69 0.44 0.38 0.45 0.79 0.47 1.19 0.65 4.74 0.95 2.31 0.96 5.95 2.44 1.11 2.69 3.53 3.07 3.48 7.78 5.65 9.82 33.95 18.93 17.16 22.59 8.42 27.96 9.33 ;第八章线性相关与回归122 第八章线性相关与回归三、多重线性回归与相关 例15-1 27名糖尿病人的血清总胆固醇、甘油三脂、 空腹胰岛素、糖化血红蛋白、空腹血糖的测量值列于表15-2中,试建立血糖与其它几项指标关系的多元线性回归方程。123 data sas8_3; input x1-x4 y @@; 5.68 4.85 4.90 4.65 7.97 5.71 5.09 5.43 11.54 ; 1.90 1.07 8.50 0.63 1.93 1.78 1.03 1.13 10.89 4.53 5.88 12.60 6.59 7.57 8.53 2.53 4.31 1.20 8.20 8.30 8.50 7.10 9.90 8.00 8.90 11.30 10.50 11.20 11.60 11.10 8.40 8.40 10.10 10.80 14.90 20.00 3.79 4.60 7.08 4.59 6.19 6.40 6.13 6.50 5.84 1.64 2.32 3.00 1.97 1.18 2.40 1.71 6.21 0.92 7.32 4.05 6.75 3.61 1.42 4.53 5.28 3.47 8.61 6.90 7.50 11.50 8.70 6.90 10.30 9.90 12.30 6.40 8.80 13.40 12.10 9.30 9.60 14.80 10.20 16.00 13.30 6.02 6.05 3.85 4.29 6.13 6.06 5.78 7.98 3.84 3.56 0.64 2.11 1.97 2.06 3.67 3.36 7.92 1.20 6.95 10.80 1.42 13.60 16.28 7.90 6.61 7.80 10.35 10.50 12.79 7.10 2.96 8.00 3.37 9.80 6.45 9.60 12.30 18.30 9.60 10.60 10.90 9.10 13.60 13.20 10.40proc reg data=sas8_3 m1: model y=x1-x4//*建立所有变量的回归模型,stb为输出标准化回归系数*/ M2: model y=x1-x4/selection=stepwise sle=0.05 sle=0.10/*逐步回归*/ R Proc corr data=sas8_3 /* nosimple为不进行简单描述*/ Var y x3; /*y关于x3的偏相关分析*/ Partial x1 x2 x4; /*扣除影响的变量*/124 第九章一、非条件LogisticLogistic回归例15-1 27名糖尿病人的血清总胆固醇、甘油三脂、 空腹胰岛素、糖化血红蛋白、空腹血糖的测量值列于表15-2中,试建立血糖与其它几项指标关系的多元线性回归方程。125 第九章二、条件LogisticLogistic回归例15-1 27名糖尿病人的血清总胆固醇、甘油三脂、 空腹胰岛素、糖化血红蛋白、空腹血糖的测量值列于表15-2中,试建立血糖与其它几项指标关系的多元线性回归方程。126 第十章生存分析一、生存分析与非参数检验 例15-1 27名糖尿病人的血清总胆固醇、甘油三脂、 空腹胰岛素、糖化血红蛋白、空腹血糖的测量值列于表15-2中,试建立血糖与其它几项指标关系的多元线性回归方程。127 第十章二、COX模型生存分析例15-1 27名糖尿病人的血清总胆固醇、甘油三脂、 空腹胰岛素、糖化血红蛋白、空腹血糖的测量值列于表15-2中,试建立血糖与其它几项指标关系的多元线性回归方程。128
更多搜索:
All rights reserved Powered by
文档资料库内容来自网络,如有侵犯请联系客服。

我要回帖

更多关于 7到16岁身高体重 的文章

 

随机推荐