DOE 一个因子对方差影响最大公因子算法,怎么实验以确定这个因子的最佳值

当前位置: >>
Minitab操作及应用教程
Minitab操作及应用制造中心 谭旭东
过程改善的D-M-A-I-C模式定义D 测量M控制C 改善I分析A 过程改善的D-M-A-D-V模式定义D 测量M验证V 设计D分析A D-M-A-I-C各阶段常用工具:定义阶段(D阶段):柏拉图、箱线图、流程分析、KANO分析、品质成本分析、因 果图等。测量阶段(M阶段):散布图、直方图、基本统计、正态检验、时间序列、条形图、 箱线图、MSA、缺陷模式和影响分析(FMEA)、过程能力分析等。分析阶段(A阶段):多变量分析、假设检验、置信区间和参数估计、回归分析、方 差分析、直方图、柏拉图、箱线图等。改善阶段(I阶段):试验设计(DOE)、脑力激荡法(鱼骨图)等。控制阶段(C阶段):控制图、预控图、统计过程控制(SPC)、作业程序等。 内容部分概念 菜单介绍 操作和应用 部分工具整理 部分概念 MinitabMINITAB = Mini + Tabulator =小型 + 计算机 样本和总体PopulationProbabilitySampleStatistics1、随机样本必须能够很好的代表总体,这样从随机样本中得到的样本统计才能够 很好的预测总体参数。 2、样本统计在预测总体参数的时候一些误差是肯定存在的,但是大样本导致的误 差肯定比小样本的少。 3、统计量是一个分布的参数,不是一个具体的值。 过程数据与SpecSpec LimitsProcess spread Tolerance width 四分位数四分位数是将数据样本分成四个相等部分的值。利用四分位数,可以快速评 估数据集的展开和中心趋势 C 这是了解数据的重要前期步骤。 由于不受极端观测值的的影响,因此与平均值和标准差相比,中位数和四分 位间距是对高度偏斜数据的中心趋势和展开程度的更好度量。 控制限位于中心线之上或之下的水平线,用于判断过程是否失控。控制上限和下限基于过程 中的预期随机变异来确定。 请勿将控制限与规格限相混淆,后者通常基于客户的要求确定,并表明希望在过程中 看到的变异量。控制限显示基于样本数据的实际变异量。过程可能处于受控状态,但 仍不能符合规格要求。 规格限产品或服务必须运行于其中的界限。规格限通常按客户要求设置。 规格限不同于控制限。规格限基于正确的拟合和功能或适当的服务所要求的条 件。控制限根据过程数据计算得到。控制限表示过程的实际执行情况,而规格限 则表明期望的性能。 实测性能过程输出中超出规格限的单元数。该统计量基于所有子组的组合数据,因此它代表 着客户的体验。实测性能可以使用每百万中的不符合数 (PPM) 或每百个中的不符合 数(百分数)来表示。 如果您没有指定规格限,Minitab 将为超出规格限的 PPM 报告一个缺失值 (*)。 研究变异在量具 R&R 中,由测量系统以及部件之间的差异导致的变异量。测量系统的变异分 为两部分: ? 重复性 C 由同一操作员重复测量同一部件所引起的变异 ? 再现性(可进一步分为操作员以及操作员*部件分量)C 由不同操作员测量同一部 件所引起的变异 Minitab 还计算百分比研究变异,以便您可以比较每个分量对总变异的作用。 默认情况下,每个分量的研究变异是其标准差的六倍,但可以更改倍数。AIAG 建议 在量具 R&R 研究中使用 6,因为 6 是从源中捕获 99.73% 的变异所需的标准差数。 理想情况下,不同部件之间的差异应该占变异性的大部分;从重复性和再现性引起 的变异性应该很小。 GR&R影响 测量系统分析 (MSA)用于评估测量系统及确定数据可信度的方法。MSA 可以帮助确定整个过程变异中 有多少是由于测量系统变异造成的。测量系统可以包括数据收集过程、量具和其 他检验设备。测量系统评估应先于控制绘图、能力分析或任何其他分析进行,以 证明测量系统精准无误,这样测出来的数据才值得信任。 MSA 工具可以帮助您评估测量系统的准确性和精确度。MSA 工具包括: ? 量具 R&R 研究(交叉和嵌套) ? 量具运行图 ? 量具线性和偏倚研究 ? 类型 1 量具研究 ? 属性一致性分析 ? 属性量具研究(AIAG 法) 量具重复性与再现性研究(Gauge R&R 研究)一种用于评估测量系统精度并估计组合的测量系统重复性与再现性的测量系统分 析 (MSA) 法。量具 R&R 研究可以帮助您回答与过程变异性相比,测量系统变异 性是否很小、测量系统中有多少变异性是由操作员之间的差异造成的,以及测量 系统是否能够在不同部件之间进行判别等问题。 例如,多个检查员测量了螺丝钉的直径,确保其符合规格。您希望确保信任数 据,因而检查检查员对同一部件的测量值是否一致(重复性)以及检查员之间的 变异是否一致(再现性)。 如果“研究变异百分比”列(公差百分比,过程百分比)中的合计量具 R&R 贡献 为: ? 小于 10% - 测量系统是可接受的。 ? 介于 10% 与 30% 之间 - 测量系统是否可接受取决于具体应用、测量设备的成 本、维修成本或其他因子。 ? 大于 30% - 测量系统不可接受,而且应该进行改进。 可区分类别数在“量具 R&R”研究中使用,表示测量系统检测被测量特征(分辨率)差异的能力。您也 可以将其视为您的测量系统可以辨别的过程数据中的组数。汽车工业行动组织 (AIAG) 出版的《测量系统分析手册》建议使用 5 个或 5 个以上的类别来表示可接受的测量系 统。例如,假设您称取不同的化学药品进行分批处理。您的配方需要化学药品 A 4000 克、 化学药品 B 75 克、化学药品 C 2 克。如果您对所有测量值都使用 5 克增量作为尺度, 显然这对于化学药品 A 来说没有问题,但是对于化学药品 B 和 C 来说就不够精确。因 此,测量化学药品 A 的尺度具有可接受的可区分类别数,因为可接受重量(3080 克到 4020 克)的变异远大于因尺度本身产生的变异。特别是当类别数小于 2 时,测量系统中将没有可以控制过程的值,因为一部分无法与另 一部分区分开。当类别数为 2 时,数据可以分为两个组,即高低组。当类别数为 3 时,数据可以分为三个组,即高中低组。值为 5 或更大表示可接受的测量系统。 量具公差(辨别力)表示测量部件时特定量具所具有的辨别力或测量增量。实践原则(称为十分规则) 表明工具辨别力应该将过程公差分成十个或更多部分。量具公差 & 过程公差/10 。过程公差是能够维持产品性质的偏离目标值的可允许偏差(过程变异)。例如,您 正在生产滚珠外径为 0.35mm 的圆珠笔。可接受的滚珠范围为 0.34 到 0.36mm。通 过用最大直径与最小直径相减,得出过程公差为 0.02。为了准确测量这些滚珠,必 须使用能够检测出此范围中的多个差异的量具。使用十分规则,计算过程公差的 10%。这表示量具必须能够检测出滚珠间至少 0.002mm 的差异。 测量系统变异当测量某个过程的输出时,既要考虑部件间的变异,又要考虑测量系统变异。例 如,您有一个刚好为 5.00 克的已知标准。经过多次称重后获得了以下读数:5.01 克、4.99 克、4.97 克、5.03 克 和 5.01 克。这些测量值之间的差异是由测量系统 变异造成的。但是,如果您称量来自生产线上的不同部件,则所出现的差异是由 于测量系统变异导致的呢还是由于部件本身的实际差异导致的?使用 Minitab 的测 量系统分析工具可以确定变异的来源。如果测量系统变异大于部件间变异,则测 量值可能无法提供有用的信息。与任何其他过程一样,测量系统既有常见原因的变异,也有特殊原因的变异。要 控制测量系统变异,必须首先识别变异的来源,然后必须排除或减少这些多种多 样的原因。 主效应和主效应图与方差分析和试验设计结合在一起使用,以检查一个或多个因子的水平均值之间的 差值。当因子的不同水平对响应的影响不同时,就存在一个主效应。主效应图中绘 制的各因子水平的响应平均值由一条线连接在一起。 要寻找的一般模式: ? 当线为水平时(平行于 x 轴),表示不存在主效应。因子的每个水平以相同方式 影响响应,而且响应平均值在所有因子水平上都相同。 ? 当线不处于水平时,表示存在主效应。因子的不同水平对响应的影响不同。线越 陡峭,主效应的量值越大。 Anderson-Darling 统计量测量数据服从特定分布的程度。分布与数据拟合越好,此统计量越小。使用 Anderson-Darling 统计量可比较若干分布的拟合情况,以查看哪种分布是最佳 分布,或者检验数据样本是否来自具有指定分布的总体。 Anderson-Darling 检验的假设如下: H0:数据服从指定分布 H1:数据不服从指定分布 如果 Anderson-Darling 检验的 p 值(如果可用)低于选定的显著性水平(通常 为 0.05 或 0.10),则可以得出结论:数据不服从指定分布。Minitab 并不始终 为 Anderson-Darling 检验显示 p 值,因为某些情况下它在数学意义上并不存 在。 如果尝试确定数据服从哪种分布,并且您具有多个 Anderson-Darling 统计量, 通常可通过比较来作出正确选择。具有最小 Anderson-Darling 统计量的分布与 数据最为拟合。如果分布具有相似的 Anderson-Darling 统计量,可基于实践经 验选择一种分布。 正态性检验确定您绘制样本所基于的总体是否呈非正态分布的单样本假设检验。许多统计过 程均依赖于总体正态性,且使用正态性检验确定否定此假设是分析中的重要步 骤。正态性检验的原假设假定总体为正态分布。备择假设假定总体为非正态分布 (了解原假设和备择假设很重要)。C4 的概率图正态9995 90 80 70均值 标准差 N AD P 值6.667 3.069 33 0.317 0.524百分比60 50 40 30 20 10 510246 C4810121416 P值确定否定假设检验中原假设的适当性。P 值范围介于 0 到 1 之间。p 值越小,错误 地否定原假设的概率就越小。进行任何分析之前,请先确定 alpha (a) 水平。常用 值为 0.05。如果检验统计量的 p 值小于 alpha,则可否定原假设。 关键是要了解每个检验中原假设和备择假设所代表的内容,然后使用 p 值来帮助做 出否定原假设的决定。 假设要对钢材强度进行回归分析,温度是其中的一个解释变量。可以看到每个回归 系数的 p 值。在此,默认检验是确定温度的估计系数是否为零。因此,原假设认为 该系数等于零======默认的一般作为原假设,而相对的就是备择假设,而备择假 设认为该系数不等于零。如果 p 值低于截止值水平,则表明温度的系数显著不同于 零,并且对您的模型而言可能是有意义的补充。 统计意义显著假设检验需要利用样本提供的信息构造适当的检验统计量,用来分析总体和样本之 间或者样本和样本之间的相关统计量(统计值)是否存在显著差异(这也是假设检 验又称之为显著性检验的原因),依此判断是不是有足够的理由相信原假设是可信 的。 如果假设检验证明样本统计量很不可能偶然发生,则该样本统计量在统计意义上显 著。通过查看检验的 p 值(当原假设成立时,获得至少与根据样本实际计算所得值 一样极端的检验统计量的概率)可以评估统计显著性。 如果 p 值低于指定的显著性 C 或 alpha (a) C 水平(通常为 0.10、0.05 或 0.01),则可以断定统计量在统计意 义上显著(差异),并否定检验的原假设。 有时候,由于样本限制,假设可能会以下列两种方式之一错误地评估统计显著性: § 类型 1 错误:假设检验断定存在统计意义显著性,而事实并非如此;错误肯定 § 类型 2 错误:假设未能检测出统计显著性,而实际上存在;错误否定 增大假设检验的功效会改进它正确检测统计显著性的能力。获得功效的方法之一是 增大样本大小。 检验统计量在假设检验期间根据样本数据计算的标准化值,用于确定是否要否定原假设。当 假设检验将观测的样本数据与原假设下所期望的数据进行比较时,比较以检验统 计量为基础。检验统计量的值对应于假设检验的 p 值。因此,当数据表现出强有 力的证据反对原假设中的假设时,检验统计量的量值将变大,而检验的 p 值可能 变得小到足以否定原假设。根据原假设中假定的概率模型,不同的假设检验使用不同的检验统计量。常见的 检验及其检验统计量包括: Alpha (a)Alpha (a) 用在假设检验中,是指拒绝真实原假设(类型 I 错误)的最大可接受风 险水平,并用 0 到 1 之间的概率表示。Alpha 经常用来表示显著性水平。您应在 开始分析之前设置 a ,然后将 p 值与 a 相比较以确定显著性: ? 如果 p 值小于或等于 a 水平,则否定原假设,而接受备择假设。p&a表明拒绝 真实原假设的风险水平够小了,所以直接拒绝它,如果p&a,那么这种风险增 大,那就不能拒绝原假设,否则风险将会很大。 ? 如果 p 值大于 a 水平,则不能否定原假设。 最常用的 a 水平为 0.05。在此水平下,发现实际并不存在的效应的几率仅为 5%。a 值越小,错误地否定原假设的几率就越小。但是,a 值越小也意味着会降 低检测到确实存在的效应的几率(功效越低)。 有时为 a 选择一个较小值会更好 ,例如要求不是很严格时;另一方面,有时选择 较大的值会更好 ,例如要求很高时。 抽样风险根据样本错误地拒绝或接受特定批次的概率。在接受抽样时,您根据从检查该批 次所得样本得到的结果接受或拒绝整个批次。由于接受或拒绝批次的决策只是基 于样本,而非整个批次的数据,因此您要冒拒绝“好”批次和接受“差”批次的风险。 例如,您接受一批 10,000 个微芯片。您有两个标准:样本大小 = 200,可接受质 量水平 (AQL) = 1.5%。如果检查 200 个微芯片中有缺陷的少于 8 个,则将接受整 批货。如果 8 个或更多有缺陷,则将拒绝整批货。质量好的批次 接受批次 拒绝批次 正确决定 生产者风险质量差的批次 消费者风险 正确决定生产者风险由 a 表示,消费者风险由 b 表示。 抽检特征曲线(OC 曲线)在图形中对这些风险进行量化,从而使您可以为将要引发 的风险选择适当的抽样计划。 类型 I 和类型 II 错误在决定否定或未能否定原假设 (Ho) 时可能发生的错误。如果在原假设为真时否定 原假设,则发生类型 I 错误。如果在原假设为假时未能否定原假设,则发生类型 II 错误。Ho 为真 未能否定 Ho 否定 HoHo 为假类型 II 错误 正确决定 类型 I 错误 正确决定请考虑类型 I 和类型 II 错误的风险,以及发生某一类型错误的概率是否比发生另 一类型错误更严重、代价更大。 发生类型 I 错误的概率为 a,这是您为假设检验设置的显著性水平。a 为 0.05 表 明,愿意接受 5% 的可能性在否定原假设时出错。 发生类型 II 错误的概率为 b,此值通常未知。但是,通过确保检验具有足够功效 可以降低犯类型 II 错误的风险。这可以通过确保样本大到足以在真正存在差异时 检测到差异而实现。 抽样验收一种检验计划,使您能够基于来自代表性样本的数据接受或拒绝收到的特定材料批 次。 例如,您收到 10,000 个微芯片的交货。您不能或不希望检验整个交货。使用抽样 验收,可以制定一个计划以确定需要检验多少微芯片(样本大小)以及样本中允许 有多少不合格品(验收数)。在本例中,假设您的可接受质量水平 (AQL) 为 1.5%,可拒绝质量水平 (RQL) 为 5.0%,并假设 alpha = 0.05,beta = 0.1。 Minitab 生成的抽样计划表明您需要检验 209 个芯片。如果所检验的 209 个芯片中 的缺陷品不超过 6 个,则可以接受整个交货。如果有 7 个或更多缺陷品,则拒绝 整个交货。 抽样验收是质量控制的主要组成部分,适用于检验的代价高于放过缺陷品的代价或 检验具有破坏性的情况。它是 100% 检验与不进行任何检验之间的一种折衷。 注意样本数量与AQL、RQL相关:不同的样本数量应该相应的增加生产者风险 (alpha)、消费者风险(beta)或者RQL与AQL的比率,比如设置的AQL 和RQL应该是不同的。 平均检出质量曲线 (AOQ)近似确定引入材料质量与检出材料质量之间的关系,假设拒收批次将被 100% 检验 且缺陷项目将返工并再次检验(校正检验)。 平均检出质量取决于引入质量、批次的接受概率以及样本和批次大小。 例如,从 500 个辊子的交货中抽取 52 个样本。如果实际缺陷百分比为 1.5%,则平 均检出质量为 1.28%(缺陷百分比)。 平均检查总数曲线 (ATI)近似确定引入材料的质量与需要检验的项目数量之间的关系,假设拒收批次将被 100% 检验且缺陷项目将返工并再次检验(校正检验)。 例如,您的抽样计划指定从 500 个辊子的交货中抽取 52 个样本。如果实际缺陷百 分比为 1.5%,则每批次的平均检验总数为 71.398 个辊子。 抽检特征 (OC) 曲线用于描述抽样验收计划的判别能力。OC 曲线绘制的是与缺陷品率相对的接受批次 的概率。 例如,您从装运的 500 个滚轮中选取了 52 个作为样本。如果实际次品率为 1.5%,那么您根据该样本接受此批次的概率为 0.9567,拒绝的概率为 0.0433。如 果实际次品率为 10%,您接受此批次的概率为 0.0966,拒绝的概率为 0.9034。评估抽样计划时,请将 OC 曲线、AOQ 曲线和 ATI 曲线结合起来分析 可接受质量水平 (AQL)以过程平均值衡量的供应商必须达到的最低质量水平。在多数情况下,您可以按 AQL 来设计接受特定产品批次的抽样计划。 例如,您收到一批微芯片交货,您的可接受质量水平 (AQL) 为 1.5%。由于您意 识到不会始终作出正确决定(抽样风险),因而将生产者风险 (alpha) 设为 0.05。这意味着,有大约 95% 的几率您会正确接受质量水平为 1.5% 或更好的批 次,另有 5% 的几率您会错误地拒绝质量水平为 1.5% 或更好的批次。 可拒收质量水平 (RQL)消费者在独立批次中愿意忍受的最低质量水平。您要设计多数时候拒收处于 RQL的特定批次产品的抽样计划。 例如,您收到一批微芯片,您的可拒收质量水平 (RQL) 为 6.5%。由于您认识到不 会始终做出正确决策(抽样风险),因此将客户风险 (beta) 设置为 0.10。这意味 着至少有 90% 的时间您将拒收质量水平为 6.5% 或更低的批次。最多有 10% 的 时间您将接受质量水平为 6.5% 或更低的批次。 通常也称为批次公差百分比缺陷 (LTPD) 和限制质量 (LQ)。 RQL 描述抽样计划将拒绝什么,而可接受质量水平 (AQL) 描述抽样计划将接受什 么。 假设检验评估有关总体的两个互斥语句的过程。假设检验使用样本数据来确定数据对哪个 语句提供最佳支持。 这两个语句被称为原假设和备择假设。 它们始终是有关总体 属性的语句,如参数值、多个总体的对应参数之间的差异,或能够最好地描述总 体的分布类型。
拟合优度检验通过分析观测值与其模型中的预期值之间的差异,确定统计模型是否与数据拟 合。对于连续数据,可以使用概率图直观评估拟合优度,也可以使用假设检验 (如 Anderson-Darling 检验)以数量方式进行评估。对于类别数据,可以使用 卡方检验或 Poisson 数据的 Minitab 拟合优度检验。Minitab 还将针对 Logistic 回归模型执行拟合优度检验。 拟合优度检验使用以下假设: ? H0 :该模型充分描述了数据 ? H1 :该模型未充分描述数据某些分析人员选择包含最高 p 值的分布,但包含不显著 p 值的任何分布都是可 接受的。 但是您可以比较他们的AD分量的大小。 功效(Beta风险)在假设检验中,当存在显著效应或差异时找到这些效应或差异的可能性。功效是在 原假设不成立时正确否定原假设的概率。(检验的功效就是当 H0 为假时正确地将其 否定的概率。) 差异(功效和样本数量)实际总体参数与假设值之间的差异;例如,通过机器生产的所有销钉的平均宽度 与目标宽度之间的差异。差异也称为总体效应,或仅称为效应。 通常,实际总体参数是未知的,因此取样并使用统计检验(如 t 检验或单因子方 差分析)来评估是否存在差异。可以使用 Minitab 的功效和样本数量分析来设计 检验,从而检测具有预期功效的预期差异。功效是检测到预期差异(如果真正存 在预期差异)的可能性。 例如,您希望了解谷类食品盒的平均填充重量是否与目标(20 盎斯)相差在 0.5 盎斯之内。以前,此机器的填充重量标准差为 0.9 盎斯。如果样本数量为 45, 则可以检测出差异为 0.5 或更大,且功效为 95%(检测到差异(如果存在)的 可能性为 95%)。 如果仅取了 20 个样本,则差异必须至少为 0.76 盎斯,才能 维持 95% 的功效。 Pearson 相关系数 (r)评估两个连续变量是否线性相关。 该系数将介于 -1 和 +1 之间。绝对相关系数越接近于 1,数据点越紧密地落于 一条直线上。如果相关系数接近于 0,则表明不存在线性关系。 相关并不意味着一定存在因果关系 。 要确定模型与数据的拟合程度,可通过将相关系数平方并乘以 100 计算出 (R2) 的方差百分比。例如:相关系数 (r) 为 0.20 只能说明 4% 的方差,r=0.71 说明 50%,r=0.90 说明 81%。 Kappa表示在评估相同样本时多名评估员所做名义或顺序评估的一致程度。Kappa 统计量 常用于交叉分组(表)应用,或用在属性一致性分析(属性量具 R&R)中。 Kappa 值介于 -1 和 +1 之间。kappa 值越高,一致性就越强。 当: ? Kappa = 1 时,表明完全一致。 ? Kappa = 0 时,则一致性与偶然预期的相同。 ? Kappa & 0 时,一致性比偶然预期的还要弱,不过这种情况很少发生。 通常,kappa 值至少应该为 0.70,但 kappa 值最好接近 0.90。 R2(R 平方)响应变量变异中由其与一个或多个预测变量的关系所解释的百分比。一般而言, R2 越大,模型与数据拟合得越好。R2 始终在 0 与 100% 之间。它也被称为确定 或多重确定(在多重回归中)的系数。 通过图示拟合值与观测值可以图形化方式说明回归模型的 R2 值。左侧的回归模型占方差的 38.0%,而右侧的模型占方差的 87.4%。回归模型所占 方差越多,数据点越接近于拟合的回归线。从理论上讲,如果模型可以解释 100% 的方差,则拟合值将始终等于观测值,并因此所有数据点都将落于拟合的回归线 上。 调整的 R2响应变量变异中由其与一个或多个预测变量的关系所解释的百分比,并对于模型 中的预测变量数进行了调整。由于添加新项时任何模型的 R2 总是会增大,因此 这种调整很重要。模型的项越多,可能就拟合得更好,原因很简单,因为它有更 多项。 但是,R2 的某些增大可能只是出于偶然。 调整的 R2 对于比较不同预测变量数的模型的解释性功效是一种很有用的工具。 只有在新项对模型的改进偶然比预期的更多时,调整的 R2 才会增大。当预测变 量对模型的改进偶然比预期的少时,它将减小。 预测的 R2用于回归分析中,以表示模型对新观测值响应的预测优度,而 R2 表示模型对数据 的拟合优度。预测的 R2 可以阻止过度拟合模型,并且对于比较模型比调整的 R 2 更有用,因为计算它时使用的是不包括在模型估计中的观测值。过度拟合是指看 似可以对用于模型计算的数据集解释预测变量与响应变量之间的关系,但无法为 新观测值提供有效预测的模型。 预测的 R2 的计算过程是从数据集中系统地删除每个观测值,估计回归方程,然后 确定模型对已删除观测值的预测优度。预测的 R2 在 0 到 100% 之间,且根据 PRESS 统计量计算得出。预测的 R2 值越大,说明模型的预测能力越强。 例如,您在一家财务咨询公司工作,并正在开发预测未来市场情况的模型。您确 定的模型看起来很有希望,因为其 R2 为 87%。但是,在计算预测的 R2 时,您 会发现它下降到 52%。这可能表明模型过度拟合,且表明您的模型预测新观测值 将不会像拟合现有数据那么好。
N 缺失、N 非缺失、N 合计工作表某一列中的缺失值数、非缺失值数及观测值总数。N 缺失是指包含星号 (*) 或缺失值符号的单元格。N 非缺失是指包含实际数据的单元格。N 合计就是这两 个统计量之和或列中的观测值总数。 在 Minitab 中,您可以在会话窗口中显示这些统计量(选择统计 & 基本统计量 & 显示描述性统计)。 标准差离差的最常用度量,即数据从平均值展开的程度。极差通过用最大值减去最小值来 估计数据的展开,而标准差则是大致估计单个观测值到平均值的“平均”距离。标准 差越大,数据中的展开越大。 标准差可以用作估计过程整体变异的初步基准。 标准差的计算方法是取方差(数据离差的另一个度量)的正平方根。处理标准差通 常更方便和直观,因为它使用与数据相同的单位。例如,如果机器部件的重量以克 为单位,则其重量的标准差也以克为单位进行计算,其方差以克平方为单位进行计 算。 在正态(钟形)分布中,距离平均值的连续标准差提供了用于估计数据观测值的百 分比的有用基准。 标准差(过程能力)对过程输出的变异的估计。Minitab 使用若干种类型的标准差捕获过程中的各种变 异模式: ? 子组内标准差 (sigma组内):表示子组内的变异。例如,一个工人、一个班次 或一个批次的输出中的变异。 ? 子组间标准差 (sigma组间):表示子组间的变异。例如,不同班次或操作员的 输出之间的变异。 ? 组间/组内标准差 (sigma组间/组内):解释子组间和子组内变异的单个值。 ? 整体标准差 (sigma整体):表示整个过程输出的变异,忽略子组。其计算方法 是组合所有子组中的数据,并将其视为单个样本。这是客户所经历的变异,因为 子组之间的区别在客户收到过程输出后消失。 响应与预测变量试验中所关注的变量(测量或观测的变量)称为响应或因变量(y值)。试验中其他 影响响应并可由试验者设置或测量的变量称为预测变量、解释性变量或自变量(x 值)。 通常,在 X 轴上绘制预测变量,在 Y 轴上绘制响应变量。 随机化一种使可能影响试验结果的无关或不可控条件的效应相互平衡的技术。例如,环境 温度、湿度、原材料或操作员可能在试验过程中变化,从而无意中影响试验结果。 通过使试验运行的执行顺序随机化,您减少了试验材料或条件中的差异导致结果严 重偏倚的几率。通过随机化还可以估计材料和条件的固有变异,从而可以根据试验 中的数据做出有效的统计学论断。
按变量/按列按变量:用于基于包含的值来划分输出的类别变量(或分组变量)。 按列:用于排序或合并数据的类别值的列。 百分位数将数据集划分为若干部分。一般而言,第 n 个百分位数有 n% 的观测值位于它之 下,(100-n)% 的观测值位于它之上。第 50 个百分位数表示数据的中位数(一半观测值位于它之上,一半位于它之 下)。 在正态能力分析中,第 99.87 和第 0.13 个百分位数之间的距离等效于 6 个标准差。 百分位数线仅可用于概率图和经验累积分布函数图的专用参考线。百分位数线由在拟合分布 线处交叉的两个片段构成。一个片段与数据尺度交叉,另一个片段与百分比尺度 (根据所选选项,也可能是概率或分值尺度)交叉。 区间图(标准误条形)样本分布的图形化汇总,显示样本的中心趋势和变异性。默认区间图显示包含具有 95% 置信区间条的均值符号。 区间图对于组比较特别有用。例如,下图比较了使用四种不同方法生产的钢杆样本 的断裂强度。 尽管均值显得不同,但差异可能并不显著,因为所有区 间条都可以轻松重叠。均值之间的差异可能是显著差异,因为区间条不重 叠。 残差观测值 (y) 与其相应拟合值 (?) 之间的差。例如,下面的散点图图示了男性的体重与 身高;回归线图示了身高的每个观测值对应的体重拟合值。假设一个人身高 6 英 尺,其体重的拟合值为 190 磅。如果他的实际体重为 200,则残差为 10。残差值在回归和方差分析过程中特别有用,因为残差值表示模型能在多大程度上解 释观测数据中的变异。 方差分析 (ANOVA)检验两个或更多总体的均值相等的假设。方差分析通过比较不同因子水平下的响 应变量均值来评估一个或多个因子的重要性。原假设声称所有总体平均值(因子 水平均值)都相等,而备择假设声称至少有一个存在差异。 要运行方差分析,必须具有连续的响应变量,并且至少有一个类别因子具有两个 或更多水平。方差分析要求数据来自正态分布的总体,并且因子水平之间的方差 大致相等。 例如,您设计一个试验来评估四种试验性地毯产品的耐用性。您将每种地毯类型 的样本分别放在 10 处居室内,并测量 60 天后的耐用情况。因为只检验一个因子 (地毯类型),所以使用单因子方差分析。 如果 p 值小于 alpha,则可以得出结论:至少一个耐用性均值存在差异。要进一 步揭示特定均值之间的差异,可以使用多重比较法,如 Tukey 法。 名称“方差分析”是基于过程使用方差来确定均值是否存在差异这一方式。该过程 采用如下工作方法,即通过将组均值之间的方差与组内方差进行比较来确定这些 组都是一个更大总体的一部分还是分属具有不同特征的单独总体。 数据变换许多分析都需要正态性假设。如果数据为非正态,有时您可以应用函数以使数据近 乎正态,以便可以完成分析。 根据数据,存在许多不同的函数(如平方根、对数、幂、倒数或反正弦),可以应 用这些函数来变换数据。在您不确定要尝试哪种变换时,Minitab 可以提供帮助。 Minitab 提供了两种数据变换方法: ? Box-Cox 变换 - Minitab 仅查找最优幂变换。(W = Y^Lambda,Minitab 将使用 此公式查找 lambda 的最佳值)。尽管 lambda 的最佳估计值可能是 -5 到 5 之间的 任何数字,但在任何实际情况下,您都需要一个与容易理解的变换对应的 lambda 值,如平方根(lambda 为 0.5)或自然对数(lambda 为 0)。 Box-Cox 变换很容易理解,但是作用非常有限,而且通常找不到适合的变换。而 且,此变换仅适用于正数据。 ? Johnson 变换 - Johnson 变换与 Box-Cox 变换使用的算法不同。Johnson 变换 函数是从 Johnson 系统中的三种类型的函数中选择的。由于函数通过更改参数可涵 盖大量分布,因此 Minitab 通常会找到可接受的变换。 如果 Box-Cox 算法找不到合适的变换,请尝试 Johnson 变换(或假设数据服从非 正态分布,并且使用其他分布,而不变换数据)。Johnson 变换函数较为复杂,但 对于查找合适的变换而言功能非常强大。
Box-Cox 中心极限定理这是概率与统计的一个基本定理,阐明当样本大小较大时,不管总体分布的形状如 何,分布(来自具有有限方差的总体的随机样本的均值)将近似服从正态分布。许多 常用统计过程都要求数据近似为正态,但中心极限定理使您能够将这些有用的过程应 用于呈强烈非正态的总体。样本大小必须为多大取决于原始分布的形状。如果总体分 布是对称的,则样本大小为 5 即可获得较好的近似;如果总体分布非常不对称,则需 要较大的样本大小 ---- 50 或更多。 例如,假设一个总体服从均匀分布。左侧的均匀概率分布图表明总体是对称的,但呈 强烈非正态。但是,根据中心极限定理,此总体的样本均值的分布 (n=5) 则近似为正 态,如第二个直方图所示。此样本均值直方图包含一个叠加的正态曲线,揭示了其正 态性。 偏度数据集不对称的程度。类似于其他许多基本统计量,偏度可以帮助您初步了解数 据。可以通过图形(如直方图)或通过偏度统计量来评估偏度。 对称或非偏斜分布 在数据变得更加对称时,其偏度值接近于零。根据定义,正态 分布的数据显示出相对较小的偏度。通过沿正态数据这一直方 图的中间绘制一条线,可以轻松地看到两侧互相构成镜像。 只是无偏并不表示具有正态性。此分布的两侧仍然彼此构成镜 像,但数据远非正态分布。 对正偏斜或向右偏斜的数据这样命名是因为分布的“尾部”指向右 侧,且因为其偏度值将大于 0(即为正)。 此处是向左偏斜或负偏斜数据的示例(分布的尾部指向左侧, 且产生负偏度值)。失效率数据通常向左偏斜。 峰度数据集达到峰值的程度。与许多其他基本统计量一样,峰度可以帮助您对数据建立 初步的了解。您可以通过图形(比如直方图)直观地评估峰度,也可以通过峰度值 统计量以数学方式评估峰度。 基线:正态分布,波峰不过于平坦,也不过于尖锐。完全服 从正态分布的数据的峰度值为 0。因为显著的峰度表示非正 态数据,您可以将此统计量作为首个检验正态性的标准。波峰尖锐的数据:分布的波峰如果比正态波峰尖锐,峰度值 将为正。波峰平坦的数据:分布的波峰如果比正态波峰平坦,峰度值 将为负。 对称图用于确定样本数据是否来自对称分布。如果中位数两侧的数据以相同方式分布,则 分布为对称;也就是说,分布的尾部是镜像的图像。许多统计过程都假定数据来自 正态分布。但是,许多过程都能很好地适应非正态的情况,因此数据来自对称分布 通常就足够了。其他过程(如非参数方法)采用对称分布而非正态分布。因此,在 许多情况下对称图都很有用。 对称图对每个数据点绘制中位数在 X 轴之上的距离和中位数在 Y 轴之下的距离。图 中的参考线表示完全对称的样本。将数据点与此线进行比较,以评估数据的对称程 度。数据越对称,这些点将越接近此线。同时显示直方图,以使您可以查看分布的 形状。 在质量工具下,类似于正态性的检验。 子组在一组相同条件下产生的一组单位。子组(或合理子组)旨在表示过程的“快照”。因 此,它们必须在时间上接近,但仍相互独立。例如,模切床每小时生产 100 个塑料 部件。质量工程师在每小时的开始测量五个随机选择的部件。每个五部件样本是一 个子组。 使用子组区分过程中两种类型的变异: ? 子组内:子组内测量值之间的变异;也称为常见原因变异。 ? 子组间:可能由可识别的特殊因子(即特殊原因)导致的子组间变异。
删失当某些检验单元的确切失效时间未知时,就会发生删失。寿命检验可以产生以下数据 类型之一: ? 数据右删失―仅当失效发生在特定时间之前时才会观测到失效。成功通过该时间的 单元被视为右删失观测值。右删失数据有时是时间删失或失效删失。时间删失表示您 要在指定的时间期间内运行研究。所有在结束时仍在运行的单元即为时间删失单元。 这又称为类型 I 右删失。失效删失表示您将一直运行研究,直至观测到指定的失效 数。这又称为类型 II 右删失。 例如,假设工程师要检验五条风扇皮带。三条风扇皮带分别在 67 小时、76 小时和 104 小时处失效。当工程师在 110 小时处结束检验时,其余两条皮带仍在运行。最后 这两条皮带在 110 小时处被右删失。 ? 数据区间删失―失效发生在两个特定时间之间。区间删失数据包含单元实际失效时 间的不确定性。 ? 数据左删失―失效发生在特定时间之前。左删失数据是区间删失数据的一个特例, 其中失效时间发生在零到检查时间之间。 无偏常量可以将过程标准差的估计量除以一个无偏常量,以使前者成为无偏估计量。无偏常 量由样本大小确定,对于小型和大型样本都有效。能力分析和控制图都可以在其计 算中使用过程标准差的有偏或无偏估计量。通常,选择使用有偏还是无偏估计量取 决于公司策略或行业标准。默认情况下,Minitab 在其计算中包括无偏常量。 无偏常量包括 c4、c5、d2、d3、d4 和 c4-prime。有关这些无偏常量对不同样本大 小的值的列表。 无偏常量也称为偏倚校正因子。
相关对两个变量之间的线性关联的度量。例如,您可能认为房屋大小与其售价高度相关― ―大房子的售价相对较高,小房子的售价相对较低。Minitab 使用一个数字对相关进 行量化 - 相关系数 - 它同时描述了关系的强度和方向。相关系数的范围为 -1 到 1,其 中: 相关值 -1 或 1 表示精确线性关系,就像圆的半径与周长之间的关系。但是,在量化 过程中,实际相关值往往达不到这种完美关系。找出两个变量的相关性通常可以为回 归分析提供有用信息,后者可尝试进一步描述这种关系类型。 要注意相关性不隐含因果关系,这一点很重要。 此外,较低的相关值并不意味着不存在关系;而只是表明不存在线性关系。 运行图一段时间内过程数据的简单图形表示。使用运行图查找过程中特殊原因变异的证 据。特殊原因来自系统外部,并导致据中出现可识别的模式、偏移或趋势。消除了 变异的特殊原因时,过程即受控制。 运行图按照收集的顺序绘制单独的观测值,并在中位线处绘制水平参考线。子组大 小大于 1 时,绘制子组平均值或中位数,并用一条线进行连接。运行图还执行两种 随机性检验,提供因数据中的趋势、振动、混合和聚类所导致非随机变异的信息。 此类模式表明,观测到的变异是由特殊原因所致。 秩向列中的值分配分值:将 1 分配给列中的最小值,将 2 分配给下一个最小值,依此 类推。向相同的值(平分)分配该值的平均秩。 经排秩的分值存储在一列中。 置信带概率图或拟合线图上的直线,表示位于数据范围内的拟合线上所有点的置信上限和 下限。在拟合线图上,给定预测变量值的响应均值的置信区间是紧邻其上或其下的 置信带上的点。在概率图上,置信带表示当数据点与指定分布相拟合时它们应该落 在的区域。 该模型表明在 95% 的置信水平下,2 升肥料可获得 的平均产量在 212 到 229 克之间,它们分别是 X = 2 时的置信带下限和上限的 y 值。您可以通过评估残差的正态性来验证此回归模型的 有效性。在概率图中,所有点都落在置信带内,因 此残差是正态的。Anderson-Darling 统计量和 p 值 也确认了这一结论。 置信区间值的范围,源自样本统计量,可能包含未知总体参数的值。由于它们的随机性,来 自给定总体的两个样本一般不可能生成相同的置信区间。但是如果将样本重复许多 次,则所获得的特定百分比的置信区间会包含未知的总体参数。这些包含参数的置 信区间的百分比是区间的置信水平。描述了由来自同一总体的 20 个样本生 成的置信区间。黑线代表未知总体参数 的固定值;蓝色置信区间包含总体参数 的值;红色置信区间未包含。 中心线控制图上的水平参考线,代表所标绘的质量特征的平均值。如果过程处于受控状 态,点将围绕中心线随机变化。请勿将中心线与过程的目标值相混淆。目标是所希望的结果,而不是实际结果。 能力指数工序能力指数,是指工序在一定时间里,处于控制状态(稳定状态)下的实际加工能 力。它是工序固有的能力,或者说它是工序保证质量的能力。对于任何生产过程, 产品质量总是分散地存在着。若工序能力越高,则产品质量特性值的分散就会越 小;若工序能力越低,则产品质量特性值的分散就会越大。那么,应当用一个什么 样的量,来描述生产过程所造成的总分散呢?通常,都用6σ(即μ+3σ)来表示工序 能力 。 评估潜在能力的能力指标包括Cp、CPU、CPL和Cpk。评估整体能力的能力指标包 括Pp、PPU、PPL、Ppk和Cpm。s = R / d2(d2 = conversion factor from average range to std Dev) Cp、Cpk和PP、PPK的计算公式的差异是: Cp、Cpk计算用的是短期的标准偏差,计算不考 虑组与组之间的变异,只考滤组内样本的变异; Pp、Ppk计算用的是长期的标准偏差,计算则是 同时靠滤了组与组之间,以及组内的样本的变 异; 比如我们收集了50个数据,在MINITAB中进行工 程能力分析:Subgroup Size一栏输入 1~50的常 数时,Cp对应的四个参数会发生变化,而Pp对 应的四个参数完全相同。所以长期工程稳定,但 是短期的工程能力是变化的,我们一般关注的是 短期工程能力,即Cp和Cpk。 统计过程控制 (SPC)使用统计学方法分析过程,以便对其进行监视、控制和改进。目标是造就稳定、一致 的过程,从而产生尽可能少的缺陷。Minitab 提供若干 SPC 工具,包括: ? 控制图 C 跟踪一段时间内的统计量,以检测是否存在特殊原因变异。 ? 能力分析 C 确定过程是否有能力;即满足规格限制并产生“良好”部件。 SPC 的中心思想是控制变异,从而避免产品缺陷。在任何过程中都有两种变异:常 见原因和特殊原因。常见原因指导致任何过程中产生合乎规律的变异的原因。特殊原 因是指通常(或有意)不是过程的一部分的异常事件。尽管任何过程中都会自然发生 一定程度的常见原因变异,但确定并尝试消除变异的特殊原因非常重要。 控制图按时间顺序标绘过程数据以帮助识别常见原因变异和特殊原因变异。通过识别变异 的不同原因,可以对过程采取适当措施,而不会出现过度控制。例如,呼叫中心在 平均等待时间上存在变异性。某些变异在意料之内,是过程的特征(常见原因)。 另有一些变异在意料之外,是由正常过程以外的某些影响因素造成的(特殊原 因)。 您可以根据数据选择多个不同的控制图,但所有控制图都共享以下相同的基本组 件: ? 预期变异区域 - 控制下限与上限之间的区域。这是过程的预期执行区域,除非发 生更改。也称为常见原因变异。 ? 意外变异区域 - 控制限以外的区域。也称为特殊原因变异。针对这种变异应进行 调查并采取措施。 常用函数及计算 菜单介绍不同软件版本菜单顺序及数量上面有区别,使用的时候注意判断!! 注意经常使用帮助
操作和应用以下操作针对汉化的MINITAB-15-CN介绍,与前面的菜单纵览简介有出入 数据菜单 功能:把列数据转换为行 菜单路径:数据-&转置列 功能:把行数据转换为列 菜单路径:数据-&堆叠-&行 功能:一列拆分为多列 菜单路径:数据-&拆分列 功能:把多列合并为一列 菜单路径:数据-&堆叠-&列 功能:把一列的数据排列顺序 菜单路径:数据-&排序 功能:更改数据类型 菜单路径:数据-&更改数据类型该功能主要用于:当您输入的数据误设置为文本属性的时候,进行相关 的运算将不能进行,这时可以使用这个功能把文本属性更改为数据属 性,或者其他的更改方案。 功能:显示变量包含的数据 菜单路径:数据-&显示数据该功能主要用于:比如您设置了一个矩阵并且把这个矩阵命名为某一个 名称的时候,Minitab只是保存了这个变量,您要查看的时候需要选择这 个显示数据的命令,让对应的数据显示在Minitab的会话框中。 计算菜单 功能:计算器 菜单路径:计算-&计算器 与Excel的公式计算器类似,但是没有Excel一样包含很多函 数,这里主要是与统计相关。 功能:统计(行/列) 菜单路径:计算-&行统计量/列统计量 功能:标准化 菜单路径:计算-&标准化 功能:产生模板化数据 菜单路径:计算-&产生模板化数据 比如对于MSA分析中输入的10个人测试3个数据的数据如下左,总共是 90个数据,如果一个一个输入或者一组一组Copy的话很是麻烦的,但是 使用模板将变得很容易。 功能:分配二进制0/1值 菜单路径:计算-&产生指示变量为类别变量的每个水平创建一个指示变量,并为每个观测值分配合适的二进制 值(0 或 1)。 或者需要将类别变量转换为指示变量,以便将它们包括在回归 模型中。 功能:设置随机数获取的开始点 菜单路径:计算-&设置基数 Minitab 有一长串可用的&随机&数。如果 Minitab 始终从列表的开头开始,您将始终 得到相同的数据。为避免出现这一情况,Minitab 使用当天的时间(精确到秒或小数 秒)来选择字符串中的“随机”起始点。 设置基数可以告诉随机数生成元在何处开始。生成元将从其停止的点处继续读取, 除非指定一个新的基数。要每次都生成完全相同的随机数集合,可在每次选择随机 样本或生成随机数据时设置相同的基数。 只有在每一次建立随机数之前先运行该命令,得到的随机数才一样。 功能:矩阵简单功能 菜单路径:计算-&矩阵 主要说明矩阵的建立方法:计算-&矩阵 -&读取建立完了各个对应名称的矩阵之后,就可以进行相关的矩阵运算了。也可以用 菜单“数据-&显示数据”来查看相应的矩阵内容。 统计菜单 一、 基本统计量 用于总体平均值或平均值之间差值的假设检 验和置信区间的四个过程都基于服从正态分 布 的样本平均值的分布。根据中心限制理 论 ,随着样本数量的增加,正态分布可以越 来越好地近似于来自任何分布的样本平均值 分布。 功能:显示数据的大纲性统计数据特性 菜单路径:统计-&基本统计量-&显示描述性统计该菜单与“存储描述性统计 ”是一样的,只是这里面把结果显示在“会话窗口中”,而 “存储描述性统计”则是显示在工作表中(所以没有图形)。 功能:图形显示数据的统计特性 菜单路径:统计-&基本统计量-&图形化汇总 结 果 图 示 正态性检验:检验数据分布是否属于正态,计算两个量:AD值和p值。 H0假设是:数据分布符合正态性,通过AD值和p值决定是否接受H0。结 果 解 释如果p值大于5%(0.05)则接受H0,否则拒绝H0。 置信度区间: 功能:样本检验(Z) 菜单路径:统计-&基本统计量-&单样本Z 检验正态总体均值是否等于目标值。此检验要求总体方差已知(历史结果);如果总 体方差未知,则使用单样本 t 检验。单样本 Z 检验使用总体均值 (u) 等于假设值 (H0:u = u0) 的原假设,并针对备择假设进行检验,备择假设可以是左尾 (u & u0)、右尾 (u & u0) 或双尾 (u ≠ u0) 假设。 结 果 图 示 结 果 解 释 功能:样本检验(t) 菜单路径:统计-&基本统计量-&单样本t 将样本均值与假设值相比较。可以使用单样本t检验来评估样本均值是否等于声称的 值。单样本 t 检验将相对于样本中的变异性来比较样本均值与假设值。结果将表明 这些值之间的差异在统计意义上是否显著。在下列情况下可以使用单样本 t 检验: ? 总体标准差未知 ? 样本随机抽取自总体 结 果 图 示 与 解 释 功能:样本检验(双t) 菜单路径:统计-&基本统计量-&双样本t针对两个总体均值的假设检验,以确定它们之间是否存在显著差异。此过程使用两 个总体均值之间的差异等于假设值 (H0:u1 -u2=u0) 的原假设,并针对备择假设进行 检验,备择假设可以是左尾(u1-u2&u0)、右尾(u1-u2&u0)或双尾(u1-u2≠u0)假设。 要执行双样本 t 检验,两个总体必须彼此独立;也就是说,第一个样本的观测值与 第二个样本的观测值之间不能存在任何依赖关系。例如,独立的两组学生的考试成 绩是不相关的,但同一组学生的前后两次测量是相关的,尽管这两个示例中都有两 个样本。如果不能支持样本的独立性假设,请重新构造您的试验以使用用于相关总 体的配对t检验。
结 果 图 示 与 解 释 功能:样本检验(配对t) 菜单路径:统计-&基本统计量-&配对t对相关或相互依赖的配对观测值之间的均值差异的假设检验。配对t检验对于分析成对观测值之间 的差异、同一对象的前后测量值之间的差异以及对象相同的两种处理之间的差异很有用。此过程 可用于检验原假设:配对中的实际均值差异 (ud=u1-u2) 等于假设值(H0:ud=u1-u2=u0)。备 择假设可以是左尾(ud&u0)、右尾(ud&u0)或双尾(ud≠u0)。 例如,假设健身中心的管理人员想要确定他们的减肥计划是否有效。他们随机选择了 50 个人参 与该计划,并在参与之前和参与之后分别称量了每个人的体重。由于“前”样本和“后”样本测量的是 相同对象,而且对象在参与计划后的体重与其参与该计划前的体重相关,因此两个样本不是相互 独立的。配对 t 检验最适合用来对两者进行分析。配对 t 检验计算每对前后测量值之间的差异, 确定体重变化的均值,并报告差异均值在统计上是否显著。管理人员的检验使用了以下假设: H0:ud = 0(参与者的体重在完成计划后没有变化) H1:ud & 0(参与者的体重在完成计划后下降) 由于记录的是每个个体对象的前后测量值,因此缺少样本的独立成员之间的变异数据。其他所有 效应在很大程度上取决于减肥计划的影响。如果配对 t 检验表明配对中实测均值差异在统计上显 著,则管理人员可以断定该减肥计划有效。 配对 t 检验比双样本 t 检验更有效,因为后者包含由观测值的独立性引起的其他变异。配对观测 值之间是相互依存的,因此不会受此变异的影响。而且,配对 t 检验不要求两个样本的方差相 等。因此,如果可以用配对试验设计合符逻辑地解决所研究的问题,则将其与配对 t 检验结合使 用以获得更大的统计功效可能更有利。 结 果 图 示 与 解 释配对t的结果解释跟双样本t 的结果解释一样,但是该两 种检验方式很容易导致误 解,大家可以深入研究他们 之间的区别(一个相关、一 个不相关) 功能:比例检验(单比例) 菜单路径:统计-&基本统计量-&单比率用来确定生成特定事件的试验的比率是否等于目标值。此过程检验总体比率 (p) 等 于假设值 (H0:p = p0) 的原假设。备择假设可以是左尾 (p & p0)、右尾 (p & p0) 或 双尾 (p ≠ p0) 假设。 假设要检验激光器成品率是否达到90%,随机抽取1000个器件进行测 试,发现合格的器件数目为883个,检验总体成品率。结 果 图 示 与 解 释
功能:比例检验(双比例) 菜单路径:统计-&基本统计量-&双比率 使用双比率命令可计算置信区间 并执行两个比率之间差值的假设检验 。Minitab 为两个比率之间的差值提供两种假设检验:Fisher 精确检验 (利用超几何分布的 概率密度函数和累积概率密度函数进行检验)和基于正态近似的检验(利用近似 的正态分布)。正态近似检验对于这样的样本可能不够精确:即任何一个样本的 事件数小于五,或者任何一个样本中的试验数和事件数之差小于五。Fisher 精确 检验对于所有样本数量 都是精确的,但只能在原假设声明总体比率相等时才能进 行计算。换句话说,只有在选项子对话框中指定检验方差为零时,Minitab 才执行 Fisher 精确检验。 假设要检验产品A的成品率和产品B的成品率是否相等,随机抽取1000个 器件进行测试,发现合格的产品数目A为890个,B为915个。结 果 图 示 与 解 释
功能:方差检验(单方差) 菜单路径:统计-&基本统计量-&单方差 计算标准差 的置信区间 和总体的方差 ,并执行假设检验 以确定总体方差是否 等于指定值。 结 果 图 示 与 解 释 功能:方差检验(双方差) 菜单路径:统计-&基本统计量-&双方差用来对使用 F 检验和 Levene 检验的两个总体之间方差的相等性或齐次性执行假设 检验。许多统计过程(包括双样本 t 检验过程)都假定两个样本来自方差相等的总 体。双方差检验过程将检验此假设的有效性。此过程使用两个方差相等 (H0:s21 = s22) 的原假设,并针对备择假设进行检验,备择假设可以是左尾 (s21 & s22)、右 尾 (s21& s22) 或双尾 (s21≠ s22) 假设。 此检验还可用于验证方差相等的假设,这是某些统计过程的基础。 它还可用于质量改进情况:您可以使用此检验来比较子组内方差和子组间方差。此 外,还可以使用此检验来比较质量改进计划实施前后的过程方差。 结 果 图 示 与 解 释
功能:相关 菜单路径:统计-&基本统计量-&相关计算所列每对变量之间的 Pearson 积矩相关 系数。 可以使用 Pearson 积矩相关系数来度量两个变量之间线性关系 程度。相关系数假 定为介于 -1 与 +1 之间的值。如果一个变量倾向于随其他变量的减小而增加,则相 关系数为负。反之,如果两个变量都倾向于同时增加,则相关系数为正。 结 果 图 示 与 解 释 功能:相关 菜单路径:统计-&基本统计量-&协方差可以为所有列对计算协方差 。与 Pearson 相关 系数相似,协方差是对两个变量之 间关系的度量。但是,协方差未像相关系数那样被标准化。相关系数的标准化是 通过除以两个变量的标准差实现的。 功能:正态性检验 菜单路径:统计-&基本统计量-&正态性检验可以选择以下假设检验来检验正态性: ? Anderson-Darling 检验(默认设置),是一种基于 ECDF(经验累积分布函 数)的检验。 ? Ryan-Joiner 检验(类似于 Shapiro-Wilk 检验),是一种基于相关的检验。 ? Kolmogorov-Smirnov 检验,是一种基于 ECDF 的检验。 Anderson-Darling 和 Ryan-Joiner 检验在检测非正态性方面具有相似功效。 Kolmogorov-Smirnov 检验的功效要小一些。 这三个检验的常用原假设为 H0:数据服从正态分布。如果检验的 p 值小于 a 水 平,则可否定 H0。 使用 Poisson 分布的拟合优度检验 可以检验以下假设: H0:数据服从 Poisson 分布 H1:数据不服从 Poisson 分布 与数据的正态性检验功能相同,只是一个针对正态分布,一个针对泊松分布。 略 二、 回归 生成方程以描述一个或多个预测变量与响应变量之间的统计学关系,并预测新观测 值。回归一般使用通过使平方残差之和最小化来导出方程的普通最小二乘法。 回归结果表明预测变量与响应之间关系的方向、大小和统计学显著性。 ? 每个系数的符号表明关系的方向。? 系数表示保持模型中其他预测变量恒定时,预测变量的单位变化导致的响应平均 变化。 ? 每个系数的 P 值检验系数等于零(无效应)这一原假设。因此,较低的 p 值说明 预测变量对模型而言是有意义的补充。 ? 方程在给定预测变量值的情况下预测新观测值。含一个预测变量的模型称为简单线性回归,否则称为多元线性回归。 Minitab 提供最小二乘、偏最小二乘以及 Logistic 回归过程: ? ? ? 当响应变量为连续变量时,请使用最小二乘过程。 当预测变量高度相关或数目超过观测值时,请使用偏最小二乘回归。 当响应变量为类别变量时,请使用 Logistic 回归。需要首先进行的工作是描 绘散点图以便初步判定图 形点的关系!! 对于高次或者曲线(指 数、抛物线、双曲线等) 回归,进行相应的变换或 者利用二元即可等效为直 线回归。 一个变量的最小二乘法的拟合直线的算法:y = a*x +b n * ∑ xi yi ? ∑ xi * ∑ yii =1 i =1 i =1 n n na=n * ∑ xi2 ? (∑ xi ) 2i =1 i =1nnb=∑yi =1ni? a * ∑ xii =1nn 仅当满足以下假定时,普通最小二乘 (OLS)回归才会提供最精确的无偏估计 值。 1) 回归模型的系数为线性系数。最小二乘可通过变换变量(而不是系数)来为 曲率建模。您必须指定适当的函数形式才能正确地为任何曲率建模。二次Y = bo+ b1X + b2X2,在此,对预测变量 X 进行了平方计算以便为曲率建模。 2) 残差的平均值为零。模型中包含常量将迫使平均值等于零。 3) 所有预测变量都与残差不相关。 4) 残差与残差之间不相关(序列相关)。 5) 残差具有恒定方差。 6) 任何预测变量都不与其他预测变量完全相关 (r=1)。最好也避免不完全的高度 相关(多重共线性)。 7) 残差呈正态分布。 由于仅当所有这些假定都满足时,OLS 回归才会提供最佳估计值,因此检验这 些假定极为重要。 常用方法包括检查残差图、使用失拟检验以及使用方差膨胀 因子 (VIF) 检查预测变量之间的相关性。这些参量都在图示中有所表示。 功能:回归 菜单路径:统计-&回归-&回归
功能:回归 菜单路径:统计-&回归-&逐步 出于识别预测变量的有用子集的目的,逐步回归删除变量和向回归模型中添加变 量,将影响因变量y的因素逐个添加到回归模型中以便找到最佳的回归方程,从而可 以筛选出关键的少量影响因素。 Minitab 提供三个常用过程:标准逐步回归(添加和删除变量)、向前选择(添加变 量)和向后消元(删除变量)。 ? 当您选择逐步法时,可以在初始模型中的预测变量中输入一组初始预测变量。如 果这些变量的 p 值大于入选用 Alpha 值,则删除这些变量。如果无论变量的 p 值大 小是多少都要在模型中保留变量,请在主对话框的每个模型中都必须包括的预测变 量中输入这些变量。 ? 当您选择逐步法或向前选择法时,可以设置 a 的值以便在入选用 Alpha 的模型 中输入新变量。 ? 当您选择逐步法或向后消元法时,可以设置 a 值以便从删除用 Alpha 的模型中 删除变量。 注意使用逐步回归时,如果要进行干预的话应该使会话窗口处于活动状态,选择 编辑器 & 启用命令,以使 Minitab 显示会话命令。 如果不需要干预的话,则在“方法”中输入与主窗口同样的变量。
功能:回归 菜单路径:统计-&回归-&最佳子集最佳子集回归确认可用您所指定的预测变量 构建的最佳拟合回归 模型。最佳子集 回归是用尽可能少的预测变量确认实现目标的模型的有效方式。实际上,子集模型 可以估计回归系数 ,而且预测未来响应得到的方差比使用所有预测变量的完整模 型更小 。 功能:回归 菜单路径:统计-&回归-&拟合线图 此过程使用一个预测变量的线性项和多项式(二阶或三阶)项执行回归(如果请 求),并以实际尺度或 log10 尺度绘制通过数据的回归线图。多项式回归是一种通 过扩展简单线性回归模型以包括 X^2 和 X^3 作为预测变量(等效多元回归),从 而为响应变量 (Y) 和预测变量 (X) 之间关系中的弯曲建模的方法。 三、方差分析 方差分析 (ANOVA) 与回归分析类似,它也是用来分析响应变量与一个或多个 预测变量之间关系并为之建模的。比如在生产中,常常需要分析哪几个因素对 产品的质量有显著影响,找出最佳的影响因素从而进行改进。 方差分析法本质上是关于多个具有方差齐性的正态总体,对其均值做检验和估 计的统计方法,因为其统计分析的依据是通过分析离差的平方得到的,所以习 惯上称方差分析。 方差分析将用于检验两个总体平均值相等性的双样本 t 检验扩展到更一般的比 较两个以上平均值相等性的原假设,即相对于它们并非全都相等。 根据方差分析对象的因素数(即自变量x的数量)和因素的水平(因素所设置的 值,比如只是考虑电压的影响,影响灵敏度的因素为电压,这是一个单因素,而 这个电压做拉偏实验时为3.1V、3.3V、3.5V,共三个水平)设置情况有下面的分 析方法: 1、单因素方差分析:单个因素两个以上的水平,确定因素的各水平对因变量y的 变差的影响。 2、双因素方差分析:两个因素两个以上的水平,确定每一个因素对因变量y变差 的影响。 3、多因素方差分析: 1)、平衡方差分析:多个因素,每个因素有两个以上水平,各因素水平数相 同,确定每个因素对因变量y的变差的影响。 2)、非平衡方差分析:多个因素,每个因素有两个以上水平,但各因素水平数 不同,确定每个因素对因变量y的变差的影响。 方差分析方法可以将一组数据内的变差根据原因分解到不同的来源中,通过比较 不同来源的变差贡献来鉴别该来源是否重要。 方差分析表:(比如在DOE设计下的结果)不同因素、水平以及相互作用是否对结果有显著影响,主要是 通过p值表征,理想的情况是各因素、各水平以及各相互作用对 应的p值都大于0.05,也就是对结果都没有显著影响,而测试结 果数值之间的差别只是由随机“误差”引起的,也就是说,方差 分析表中的“误差”一项是没有对应p值的。 另外,主要所谓的“交互作用”,比如A和B两个因素及其下面的 许多水平,A、B各有其“主效应”,也就是A、B因素分别对结果 造成的影响(当然他们是存在着搭配一起对应一个实验结果 的),还有AB的交互作用,当A、B搭配只记录一个测试数据 的时候,方差分析表不会计算交互作用,只有记录多个数据之 后才会计算交互作用,有交互作用则表明,对应A的某一个水 平,有且只有B下面的某一个水平与之搭配得到一个最理想的 结果! 功能:方差分析 菜单路径:统计-&方差分析-&单因子 统计-&方差分析-&单因子(未堆叠存放) 输入介于 0.5 和 0.001 之间 的全族/个别误差率。大于等 于 1.0 的值解释为百分比。 默认误差率为 0.05。使用以下四种不同方法为平均值之间的差异提供置 信区间 :Tukey 、Fisher 、Dunnett 和许氏 MCB 。Tukey 和 Fisher 为水平平均值之间的所有 配对差异提供置信区间。Dunnett 为每个处理平均 值与控制平均值之间的差异提供置信区间。许氏 MCB 为每个水平平均值与其他水平平均值中的最 佳值之间的差异提供置信区间。Tukey、Dunnett 和许氏 MCB 检验都使用全族误差率 ,而 Fisher 的 LSD 过程则使用个别误差率 。 具体使用哪种多重比较检验取决于所需的推断。当 适合使用 Dunnett 或许氏 MCB 时,使用 Tukey 所 有配对方法会缺乏效率,因为 Tukey 置信区间更 宽,并且对于给定的全族误差率而言,假设检验并 不是很有效。由于相同的原因,如果要排除非最佳 因子水平并找出最佳或接近最佳的因子水平,则许 氏 MCB 优于 Dunnett。选择 Tukey 还是 Fisher 取 决于要指定的误差率属于哪一种:全族或个别。
功能:方差分析 菜单路径:统计-&方差分析-&双因子双因子方差分析可在按两个变量或因子 对处理进行分类时检验总体 均值是否相 等。对于此过程,数据必须平衡(所有单元必须有相同数量的观测值),因子必 须是固定 的 。
功能:方差分析 菜单路径:统计-&方差分析-&平均值分析 绘制正态、二项和 Poisson 数据的平均值分析图 (ANOM) 。平均值分析 (ANOM) 是方差分析的图形模拟,用于检验总体平均值的相等性。
功能:方差分析 菜单路径:统计-&方差分析-&平衡方差分析 菜单路径:统计-&方差分析-&一般线性模型 菜单路径:统计-&方差分析-&平衡多元方差分析 菜单路径:统计-&方差分析-&一般多元方差分析略 功能:方差分析 菜单路径:统计-&方差分析-&完全嵌套方差分析所有因子 都隐含假定为是随机 因子,如果设计不是分层嵌套或者有固定因子,请使 用平衡方差分析或一般线性模型。如果要将调整平方和用于完全嵌套模型,请使用 一般线性模型。 按与平衡方差分析或一般线性模型相同的方式设置工作表:每个响应变量一列, 每个因子一列,使每个观测值占据一行。 嵌套不需要平衡。在被嵌套因子的某些水平上,嵌套因子必须至少具有2个水 平。如果因子 B 嵌套在因子 A 中,则在 A 的每个水平内可以有不同的 B 水平。 此外,用于标识 B 水平的下标在 A 的各个水平中可以不同。
功能:方差分析 菜单路径:统计-&方差分析-&等方差检验包括方差分析在内的许多统计过程都假定,尽管不同样本可能来自平均值不同 的总体,但它们具有相同的方差。不等方差对推断的影响部分取决于模型包含 的是固定还是随机因子、样本数量的不一致性以及选择的多重比较过程。如果 模型只包含固定因子并且样本数量相等或接近相等,那么方差不等对方差分析 中的 F 检验只有轻微影响。不过,涉及随机效应的 F 检验可能会受到相当大的 影响 。使用方差检验过程可检验等方差假设的有效性。
功能:显示置信区间或者误差条 菜单路径:统计-&方差分析-&区间图选择单个Yi 即一个y的 简单,与 index一起 选择则是含 组。 多个Y的简 单即在一个 图中显示 (一个Yi的 简单是多个 图),连同 index即为 含组。
视图设置的部分意义: 功能:绘制数据平均值 菜单路径:统计-&方差分析-&主效应图 图中的点是每个因子各个水平的响应变量的平均值,并在响应数据的总平均 值 处绘制了一条参考线。使用主效应图可以比较主效应的大小。 功能:绘制数据平均值 菜单路径:统计-&方差分析-&交互作用图交互作用图为两个因子创建一个交互作用图,或者为三个到九个因子创建交互 作用图的矩阵。交互作用图是一个因子的水平保持恒定时另一个因子的每个水 平的均值图。交互作用图对于判断是否存在交互作用很有用。 当某一因子水平上的响应依赖于其他因子的水平时,即表示存在交互作用。如 果交互作用图中的线平行,则表示不存在交互作用。线偏离平行状态的程度越 大,则交互作用程度越高。要使用交互作用图,必须能获得所有水平组合的数 据。 存在交互作用,也就是说,品种1不一定都好,可能在现场1好,而在现场2可能是 品种2好了。如果不存在交互作用,那么品种1不管在什么现场下都是最好的。 四、 DOE(实验设计) 因子:实验中的因素,比如影响焊接的因素为脉宽、频率、电压等,这三个因素称 为因子。 水平(位级):各个因素的取值,比如脉宽取2ns、4ns、6ns,那脉宽的水平数为3 个。 响应:考核的指标,比如用功率来考虑上述的三个因素不同水平下的影响。 运行:测量响应的每个试验条件或因子水平组合。通常,每个运行对应于工作表中 的一行,并产生一个或多个响应测量值(即观测值)。注:进行试验时,应使运行 顺序随机化。每个运行对应于一个设计点,而整组运行即为设计。在同一试验条件 下的多次执行被视为单独的运行,称为仿行。 仿行:因子设置(水平)相同的多次试验运行。仿行依相同的变异性来源而定,彼 此独立。可以仿行因子水平的组合、因子水平组合的组或整个设计。在试验设计 中,仿行测量值取自相同但不同次的试验运行。这是与重复相比而言,重复只是相 同设置下的重复观测值。可以使用仿行估计由略微不同的试验条件导致的变化(试 验误差)。试验误差作为基准,确定数据中观测到的差异是否为统计学意义的不 同。为确保观测并量化所有试验变异性,应对仿行随机化,以覆盖试验条件的整个 范围。如果运行数太大,以致无法在稳定的状态条件下完成,则可对仿行划分区 组。通过划分区组可以独立于试验误差估计区组效应。 工业上提到更多的是正交实验设计,最早由日本质量管理专家田口玄一提出。 如果实验只是考察一个因素对实验结果的影响,称为单因素实验;如果考察两个 或者两个以上的则为多因素实验。单因素实验可以用优选法完成,而多因素实验 必须用正交实验法设计完成。 如果实验中有i个因素,每个因素有j个水平,那么完全因素水平的组合即全部实验 的次数为N=j^i次,理论上只有进行全部实验(完全因素水平组合)才能准确的找 到最佳的因素水平组合(最佳的实验配对方案),但是实际上很多时候是不可能 的,正交实验法可以进行一定置信度下的合理的统计抽样保证在部分因素水平组 合下的实验提供准确的结果信息。 正交实验表的符号:Ln ( j )iL表示正交表的代号。 n表示正交表的行数(实验次数) j表示正交表数码(因素的水平数) i表示正交表的列数(因素的个数)L9 (3 )4左图是L9(3^4)的正交表,严格的说,因 为这里面有4个因素,每个因素有3个水 平,如果采用一般的因子设计的话则总 的实验数应该是3^4=81个实验,但是采 用正交表的实验方法的话可以进行9次实 验即可。 L? (34 )4个因素3个水平的因子设计在Minitab中的比较:菜单路径:统计-&DOE-&因子-&创建因子设计 L? (34 )4个因素3个水平的因子设计在Minitab中的比较:菜单路径:统计-&DOE-&田口-&创建田口设计 由于实际中常用到的 是正交实验,所以对 于DOE,我们只进 行田口设计(正交设 计)的介绍。 功能:DOE 菜单路径:统计-&DOE-&田口田口设计 或正交表是一种设计试验的方法,这种设计通常只需要全因子组合的 一部分。正交表意味着设计是平衡的,即各个因子水平被赋予相等的权重。因 此,可以独立于所有其他因子来估计每个因子,这样,一个因子的效应便不会影 响另一个因子的估计。 稳健设计又叫动静参数设计,是日本著名质量管理专家田口玄一博士在七十年代 初从工程观点、技术观点和经济观点对质量管理的理论与方法进行创新研究,创 立了“田口方法(Taguchi Methods)。 田口方法可应用于产品设计、工艺设计和 技术开发阶段,从而可提高产品设计质量,降低成本,缩短研制开发周期。稳健性试验的目的是找到控制因子 设置的最优组合,以获得对噪声因子 的稳健 性(对噪声因子不敏感)。 田口设计主要用来研究因子的主效应。有时侯,可能需要研究一些双因子交互作 用。 望目特性:存在固定目标值,希望质量特性围绕目标值波动,且波动越小越好,这样 的质量特性称为望目特性 望小特性:不取负值,希望质量特性越小越好(理想值为0),且波动越小越好,这样饿 质量特性称为望小特性 望大特性:不取负值,希望质量特性越大越好(理想值为∞),且波动越小越好,这样 的质量特性称为望大特性 动态特性:目标值可变的特性,称为动态特性,与之相对的,望目特性,望小特性, 望大特性统称为静态特性 外干扰(外噪声):由于使用条件及环境条件(如温度,湿度,位置,操作者等)的波动或 变化,引起产品质量特性值的波动,称之为外干扰,也称为外噪声。请注意,外噪声 并非常说的噪音 内干扰(内噪声):产品在储存或使用过程中,随着时间的推移,发生材料变质等老 化,劣化现象,从而引起产品质量特性值的波动,称之为内干扰,也叫内噪声。 产品间干扰(产品间噪声):在相同生产条件下,生产制造出来的一批产品,由于机 器,材料,加工方法,操作者,测量误差和生产环境(简称5M1E)等生产条件的微小变 化,引起产品质量特性值的波动,称为产品间干扰,也称为产品间噪声。 可控因素:在试验中水平可以人为加以控制的因素,称为可控因素 标示因素:在试验中水平可以指定,但使用时不能加以挑选和控制的因素称为标示 因素。 误差因素:引起产品质量特性值拨动的外干扰,内干扰,产品间干扰统称为误差干 扰。 稳定因素:对信噪比有显著影响的可控因素,称为稳定因素。 调整因素:对信噪比无显著影响,但对灵敏度有显著影响的可控因素,称为调整因 素。 次要因素:对信噪比及灵敏度均无显著影响的可控因素称为次要因素。 信号因素:在动态特性的稳健设计中,为实现人变动着的意志或赋予不同目标值而 选取的因素,称为信号因素。 稳健性:指质量特性的波动小,抗干扰能力强。 信噪比:稳健设计中用以度量产品质量特性的稳健程度的指标。 灵敏度:稳健设计中用以表征质量特性可调整性的指标。 稳健设计:以信噪比为指标,以优化稳健性为目的的设计方法体系。 内设计:在稳健设计中,可控因素与标示因素安排在同一正交表内,进行试验方案 的设计。相应的正交表称为内表(内侧正交表),所对应的设计称为内设计。 外设计:在稳健设计中,将误差因素和信号因素安排在一张正交表内,进行试验方 案的设计,相应的正交表称为外表(外侧正交表),所对应的设计称为外设计。 假设我们进行一个实验,确定几个因素对拉力的影响。 首先,确定因素为3个,分别为:气压、电压、放电时间。 其次,确定各个因素的水平,分别为:气压(0.18、0.2、0.22),电压(180、 200、220),放电时间(2、4、6)。1、选择设计2、确定正交实验的次数 3、设定因素及其各个水平数值得到我们的实验因素和水平的正交组合4、根据正交表设计得到的因 素水平组合进行对于的实 验,并且记录对应的组合导 致的实验结果。 5、对田口设计的结果进行分析 6、结果分析
7、预测 五、 控制图 使用控制图跟踪一段时间内的过程统计量并检测是否存在特殊原因。 Minitab 绘制过程统计量(如子组 平均值、单个观测值、加权统计量或缺陷 数)与 样本编号或时间的对比图。Minitab 绘制以下内容: ? 默认情况下在统计量的平均值处绘制中心线。 ? 默认情况下在中心线以上 3s 处绘制控制上限 。 ? 默认情况下在中心线以下 3s 处绘制控制下限 。特殊原因所导致的变异可以检测并受控制。示例包括供应商、班次或周中天数的差 异。而另一方面,常规原因变异是过程中所固有的。当只有常规原因(而非特殊原 因)影响过程输出时,过程即受控制。 当点落于控制限制的界限之内,且这些点未显示出任何非随机模式时,过程即受控 制。使用随 Minitab 的控制图提供的特殊原因检验来检测数据中的非随机模式。 子组 在一组相同条件下产生的一组单位。子组(或合理子组)旨在表示过程的“快照”。因 此,它们必须在时间上接近,但仍相互独立。例如,模切床每小时生产 100 个塑料部 件。质量工程师在每小时的开始测量五个随机选择的部件。每个五部件样本是一个子 组。 使用子组区分过程中两种类型的变异: ? 子组内:子组内测量值之间的变异;也称为常见原因变异。 ? 子组间:可能由可识别的特殊因子(即特殊原因)导致的子组间变异。此单值图显示了从模切床抽取的样本值。 每条带红色符号的垂直线表示子组中的 值。蓝色区间表示子组内变异,红色平均 值连接线表示子组间变异。为改进过程质量,您应该努力消除子组间 变异并减少子组内变异。 阶段 过程中有意义的时期,如实施改进之前或之后。阶段用于创建显示过程在特定时间 段内的变化的历史控制图。在每个阶段中,Minitab 重新计算控制图中的中心线和控 制限。此历史控制图显示过程的三个阶段,分别表示实施新过程之前、之中和之后。 通过阶段,可以看出过程中的过程平均值(中心线)和期望变异(上下控制限 之间的区域)随时间变化而减小。 功能:数据变换 菜单路径:统计-&控制图-&Box-Cox变换Box-Cox 变换对于纠正过程数据中的非正态性以及与子组平均值相关的子组过程变 异非常有用。在大多数情况下,除非数据的偏斜非常大,否则不必纠正非正态性。 Wheeler 和 Wheeler and Chambers 建议不必变换控制图中使用的数据,因为控制 图在数据非正态分布的情况下仍能正常工作。它们出色地展示了从多种非均衡分布 中收集数据时的控制图性能。 Minitab 仅查找最优幂变换。W = Y^Lambda,Minitab 将 使用此公式查找 lambda 的最佳值。尽管 lambda 的最佳 估计值可能是 -5 到 5 之间的任何数字,但在任何实际情 况下,您都需要一个与容易理解的变换对应的 lambda 值,如平方根(lambda 为 0.5)或自然对数(lambda 为 0)。 Box-Cox 变换很容易理解,但是作用非常有限,而且通常 找不到适合的变换。而且,此变换仅适用于正数据。 使用Box-Cox变 换只是一个目 的,当通过变换 找到Lambda值之 后在进行控制图 的绘制或者能力 指数的计算的时 候就需要用到该 Lambda值进行设 置。 功能:均值/极差控制图 菜单路径:统计-&控制图-&子组的变量控制图 -&Xbar-R由于控制图选项很多是一样的,只是针对的控制值(子组均值、极差、标准 差等)不一样,所以我们只是选择均值/极差进行介绍,其他类似。 以一组简单的数据示例:
注意,中心线及极限有的参数是包含无偏变量在计算公式里面的,所以有时跟“认 为”的计算结果不同。关于无偏变量可以参见Minitab的说明手册。 六、 质量工具 功能:找过程数据中模式的证据 菜单路径:统计-&质量工具-&运行图所有过程中都会发生变异。常规原因变异是过程中正常的一部分。另一种类型的 变异(称为特殊原因)来自系统外部,并导致数据中可识别的模式、偏移或趋 势。运行图显示特殊原因是否正在影响您的过程。当只有常规原因影响过程输出 时,过程受控制。运行图执行两种随机性检验,提供有关因趋势、振动、混合和 聚类引起的非随机变异的信息。 受控制过程的正态模式即为一种随机性。如果过程中只存在变异的常规原因,则 数据将表现出随机行为。 当子组大小等于 1 时,两个检验都以单个观测值为基础。当子组大小大于 1 时,检验以子组平均值(默认)或子组中位数为基础。 对于两种检验,原假设都为数据具有随机序列。运行图将观测到的运行次数转 换成大致为标准正态的检验统计量,然后使用正态分布获取 p 值。这两个 p 值 对应于与检验统计量相关联的单侧概率。当这两个 p 值中任意一个小于 a 值 (显著性水平)时,拒绝随机性假设。 这里的p值均大于0.05,表明过程没有受到特殊原因的影响。 中位数检验以中位数 上下发生的总运行次数为基础。在此检验中,运行是位于中位 数同一侧的一个或多个连续的点。如果这些点用一条线连接起来,则运行在该线穿 过中位数时结束。新的运行从下一个标绘点开始。 中位数附近运行次数的检验对两种类型的非随机行为(混合和聚类)敏感: ? 在统计意义上大于预期的观测运行次数支持混合的备择(对应于右尾拒绝区 域)。 ? 在统计意义上小于预期的观测运行次数支持聚类的备择(对应于左尾拒绝区 域)。 向上或向下检验以向上或向下(增加或减少)运行次数为基础。在此检验中,运行 是相同方向的一个或多个连续的点。每当数据序列中出现方向(上升或下降)变化 时,一个新的运行即告开始。例如,随着值的增加,向上运行将继续,直到一个值 大于下一个点为止,然后向下运行即告开始。 向上或向下运行次数的检验对两种类型的非随机行为(振动和趋势)敏感。 ? 在统计意义上大于预期的观测运行次数支持振动的备择(对应于右尾拒绝区 域)。 ? 在统计意义上小于预期的观测运行次数支持趋势的备择(对应于左尾拒绝区 域)。 功能:数据统计 菜单路径:统计-&质量工具-&柏拉图 功能:头脑风暴 菜单路径:统计-&质量工具-&因果图因果图测量 材料 人员微米合金班次 主管人显微镜滑润剂 培训检查员供应商运算符结果刹车 凝聚 接触 湿度 % 角度 位 套接字 速度 车床环境方法机器 功能:检验数据分布 菜单路径:统计-&质量工具-&个体分布标识 用于在执行能力分析研究之前,基于概率图和拟合优度检验来评估数据的最优分 布。 还可以使用分布标识并通过 Box-Cox 变换或 Johnson 变换来变换数据以使其服从正 态分布。14种分布函数的形式 如下页图示,分别给 出了概率分布表达式 (pdf)、逆概率分布 表达式(cdf)、平均 值和标准差。选 择 各 函 数 时 坐 标 组 成
功能:数据变换 菜单路径:统计-&质量工具-&Johnson变换Johnson 变换 会从变量的三个系列的分布中选择一个最优函数,它们可以轻松地 变换为标准正态分布。这些分布被标记为 SB、SL 和 SU,其中 B、L 和 U 分别指 有界限变量、对数正态分布的变量和无界限变量。Minitab 显示原始数据和变换后 数据的正态概率图及其 p 值,以便进行比较。您还可以存储变换后的数据供以后 进行分析。 如果 Johnson 变换不能充分变换数据,则使用 Box-Cox 变换可能会更好;请使用 更适合您的数据的正态变换方法。
功能:能力分析 菜单路径:统计-&质量工具-&能力分析-& 正态 过程一旦处于统计控制状态下(即稳定生产)后,您就可能要确定其是否有能力(即符合规格限制并 生产出“良好”的部件)。您通过将过程变异的宽度与规格限制的宽度相比较来确定能力。过程需要处 于受控状态,然后才能评估其能力;否则,会错误地估计过程能力。只有过程受控,才有能力一说。 为正确使用能力统计量,应通过检查位置的控制图(如 Xbar 控制图或 I 控制图)或变异的控制图(如 R 控制图、S 控制图或 MR 控制图)来证实过程稳定。Capability Sixpack 的优势之一是,它包括适当 的控制图作为其输出的一部分。 在使用能力分析之前确认与您的数据相拟合的分布,或者将数据变换为服从正态分布。根据数据及其 分布的特性,可以对以下各项执行能力分析: ? 正态或非正态概率模型(对于测量数据) ? 可能具有较强的子组间变异源的正态数据 ? 二项或 Poisson 概率模型(对于属性或计数数据) 进行能力分析时,必不可少的一点就是要选择正确的分布。在执行能力分析之前,您可以使用个体分 布标识来选择与数据最为拟合的分布。统计量的有效性取决于假定分布的有效性。当观测值来自偏斜 的分布时,基于正态分布的能力指数(如 Ppk 和 Cpk)可能看起来很“好”,但实际上有许多单位仍将 “超出规格”。当数据的分布未知时,请使用个体分布标识选择与数据最为拟合的分布。Minitab 还使您 可以使用 Box-Cox 或 Johnson 变换方法将数据变换为服从正态分布。 Minitab 同时提供了基于正态和非正态概率模型的能力分析。使用正态概率模型的命令提供一组更完整 的统计量,但是您的数据必须接近于正态分布,这些统计量才适用于您的数据。统计量的有效性都取 决于假设分布的有效性。 如果怀疑过程中存在较强的子组间变异源,请使用“能力分析(组间/组内)”或“Capability Sixpack(组 间/组内)”。除了子组内的随机误差外,子组数据可能还具有子组间的随机变异。了解这两个子组变异 源可以更现实地估计过程的潜在能力。“能力分析(组间/组内)”和“Capability Sixpack(组间/组内)” 同时计算组内和组间标准差,然后将它们集中在一起计算合计标准差。
功能:能力分析 菜单路径:统计-&质量工具-&能力分析-& 组间/组内生成同时使用子组间和子组内变异的过程能力报告。在子组中收集数据时,子组内 的随机误差可能并不是唯一要考虑的变异源。子组间也可能存在随机误差。在这样 的情况下,组间/组内过程变异是由于子组间变异和子组内变异所致。设置均与正态分析一样。 功能:能力分析 菜单路径:统计-&质量工具-&能力分析-& 非正态用于在数据不服从正态分布时生成过程能力报告。 Minitab 基于分布参数的最大似然估计进行计算,而非基于正态情况下的平均值 和方差估计。您可以使用报告直观地评估过程相对于目标的分布情况,数据是 否服从指定分布,以及过程是否能够一致地符合规格。 Minitab 提供了两个选项用于计算非正态数据的整体能力指数:ISO 法和 Minitab 方法。ISO 法是默认选项。要更改选择,请用:工具 & 选项 & 控制图和 质量工具 & 能力分析。设置均与正态分析一样。 功能:量具分析 菜单路径:统计-&质量工具-&量具研究 量具重复性 和再现性 研究确定观测的过程变异中有多少是由于测量系统变异 所致。 Minitab 为量具 R&R(交叉)提供了两种方法:X 和 R 法或方差分析法。X 和 R 法 将整体变异分为三种类别:部件间变异、重复性和再现性。方差分析法进一步将再 现性划分为其操作员以及操作员与部件交互作用这两个要素。在某种程度上,方差 分析法比 X 和 R 法更准确,因为它考虑了操作员与部件交互作用 。
Minitab 提供了若干命令帮助您确定有多少过程变异是由测量系统中的变异造成的。 每次测量过程的结果都会发现变异。产生这种变异有两个来源:过程制造的部件之间的 差异,以及进行测量中的不完善。因此,重复测量相同部件也不会得到完全相同的测量 值。 统计过程控制 (SPC) 涉及到确认部件间变异的来源,以及尽可能减少这种变异以获得 更可靠的产品。但是,在执行 SPC 分析之前,可能要确定观测到的变异并非主要归因 于测量系统中的误差。 准确度通常分为三个要素: ? 线性 - 对部件大小影响测量系统准确度的度量。它是在预期测量值范围内实测的准 确性值的差异。 ? 偏倚 - 对测量系统中偏倚的度量。它是观测到的平均测量值与基准值之间的差异。 ? 稳定性 - 对系统在一段时间内准确性表现的度量。它是一段时间内测量单一特征时 用特定设备获得的同一部件的总变异。 精确度(即测量变异)可分为两个要素: ? 重复性 - 因测量设备导致的变异。它是同一操作员使用同一设备重复测量同一部件 所观测到的变异。 ? 再现性 - 因测量系统导致的变异。它是不同操作员使用同一设备测量同一部件所观 测到的变异。
功能:量具分析 菜单路径:统计-&质量工具-&量具研究-&类型1量具研究使用类型 1 量具研究来评估测量过程的能力。此研究基于来自单个部件的多个测量 值来评估偏倚 和重复性 的组合效应。 类型 1 量具研究应在进行其他量具重复性和再现性研究之前执行,后者确定观测到 的过程变异中有多少是因测量系统变异所致。
功能:量具分析 菜单路径:统计-&质量工具-&量具研究-&创建量具R&R研究工作表基于特定的量具 R&R 研究生成数据收集工作表。Minitab 要求使用某种数据组织 形式,以便能够正确地执行量具分析。此工具帮助您生成工作表以组织您所收集 的数据,以便在 Minitab 中正确地分析数据。 选项设置表示的意义见下页。 运行序列出了测量所应采取的顺序。 功能:量具分析 菜单路径:统计-&质量工具-&量具研究-&量具运行图 量具运行图是所有观测值按操作员和部件号标绘的图。在平均值(可根据数据计算 得出)或根据对过程之前的了解所输入的值处绘制水平参考线。您可以使用此图快 速评估不同操作员和部件间测量值的差异。稳定过程 使点在水平方向随机分散; 操作员或部件效应在图中呈现某种模式。
功能:量具分析 菜单路径:统计-&质量工具-&量具研究-&量具线性和偏倚研究 量具线性通过预期测量值范围指出测量值的准确度。它回答“对于所测量的所有大小 的对象,我的量具的准确度是否都相同?”这一问题。如果存在线性问题,那么导致 的问题就是:您在某一个功率点比如小功率下面测试是准确的,但是在大功率下面 测试将导致不准确。 量具偏倚检查实测平均测量值和参考值或主要值之间的差值。它回答“与主要值比 较,我的量具偏倚程度如何?”这一问题。如果存在偏倚问题,那么设备测量的值将 不是部件的准确值,就会存在一个偏差。
功能:量具分析 菜单路径:统计-&质量工具-&量具研究-&量具R&R研究(交叉)判据:根据汽车工业行动组织 (AIAG ) 的,可以使用以下准则来确定测量系统是否可接受。 如果 %研究变异 列(%公差、%过程)中的合计量具 R&R 贡献: ? 小于 10% - 则测量系统可接受。 ? 在 10% 到 30% 之间 - 则测量系统是否可接受取决于具体应用、测量设备 成本、 维修成本或其

我要回帖

更多关于 最大公因子算法 的文章

 

随机推荐