来源:蜘蛛抓取(WebSpider)
时间:2018-07-12 01:29
标签:
ftp 数据传输端口问题
大道至简-互联网数据统计的误差管理 - 简书
大道至简-互联网数据统计的误差管理
本文聊聊数据统计的误差管理。年初的一篇短文里,提到了量化“数据不充分”和尝试“容纳误导”,经过半年来ab测试实践,有了更深的体会。先插入一段学生时代的记忆,中学学工有缝纫机制作睡裤的课程,老师问了一个问题,大针脚4cm,小针脚2cm,如果需要3cm间隙的两行针,该怎么办呢?我们异口同声地说,大加小除以二,然后老师像看鬼一样看着我们说,怎么市重点的学生连这么简单的问题也不会?任何职校专科都没问题。我们全员懵b。愣了很久以后老师说,比大的小一点、比小的大一点啊。很多年以后我领悟到,这位老师无意中(或许不是无意?)正在教我们这些熟练于“小乘佛法”的所谓优秀学生以“大乘佛法”:这个回答一直到本科才领悟到(文科生可能今生就觉得缝纫老师傻),即首先根据缝纫机原理的常识,判断针脚尺寸变化是单调的,进而在目测中间位置随机选点,输出一定量的距离y以后,可以达到某种置信范围内的3cm的期望(实际上2和4也是期望,机械误差无可避免)--这里也需要假设反复测试的时候没有被老师大声呵斥,这样可能导致有极大影响的因子出现,通不过t测试。这个故事除了炫耀一路重点书呆子以外(此处应有弹幕。。。),还提出了两个很重要的概念:1、假设从生活抽象到理论的难度是1,那么理论返回来指导生活的难度可能是100。王阳明说的所谓知行合一,具体来说涉及生活提炼到理论(书本知识是来自他人的生活)和理论指导生活。那么书本知识的精确和僵化,同现实生活的繁复和随机,怎么调和呢,王的方法是哲学思辨。现代社会借助电脑多了一种方法,概率论和数理统计。大部分团队对于数据,还是处于一个“比大的小一点,比小的大一点”状态,也就是经验方法能解决问题,而数据方法就像“大加小除以二”一样,毫无现实可操作性,无法解决问题,成为一种点缀。在无数培训、讲座、博客都能看到,有人问,如果有某某误差怎么办,如果埋点漏了怎么办,如果不准怎么办。甚至出现了将错误进行到底,号称“因为根本不需埋点所以也不会漏”这种卖点噱头。实际上数据统计作为一系列理论,要应用到现实,本身就必须容纳和体现业务、技术、市场环境的种种影响,埋点的方式和范围也在其中。思想上,接受数据统计要能服务于现实,误差管理是正常的、必备的环节,既不是硬着头皮说数据没错,也不是因为数据有误差,就回滚到拍脑袋。2、“缝纫机原理的常识基础上,判断针脚尺寸是单调的”2cm和4cm的针脚中间位置,大体是3cm,而不会是5cm,这是所谓的单调预判。读者可能会说,这谁不知道呢?我们不妨把问题稍作复杂化,一段时间内埋点sdk有问题,数据有少量偏差,这时是否理解取数、传输、存储的原理(涉及基本的应用开发和通信知识),就成为能否评估量化数据误差的关键。误差管理要求杂学和扎实的基础,我们很容易发现,现在混得好的互联网市场人员,越来越多是程序员出身。互联网行业的数据统计需要太多IT常识,如果连dom,activity,cookie都不知道,基本上等于在给广告公司送钱,有些博客就专门写写如何防范乙方数据作假,也能解决大量的生活实际问题,造(de)福(zui)一方。有种说法是,数据要切实应用,需要业务+数学+工具(技术和统计),这三者都对误差有很大的影响:对于纯技术背景的分析人员来说,他们奋斗一周克服的数据坑,可能是随便拉个业务妹子都知道的常识(比如上个季度我们和xx终止合作了呀,或者zf规定xx和yy不能一起卖了呀);工具本身的结构性误差,包括采集、传输、保存的逻辑和流程,可以通过保持用同一个工具来看趋势,用两套完全不同的工具来做验证,来尽量控制。当发生明显误差时,可以定位到是采集、传输、保存中哪个步骤的问题,加以定量和解决;算法的误差,目前更大来自于“洗数据”这一部分,而这一步极其有赖于对业务和工具的深刻理解和掌握,在洗数据之后的步骤,理论研究已经走到了“完全只差更快的电脑”的地步了,现在就站在那里等数据。。。。经常有分析人员一面看着kaggle上面一个个优雅华丽的case,一面回首自己手上的勉强可算数据的一堆烂帐,黯然下楼买泡面。回到标题的大道至简所谓“简”,可能是当暮然回首的时候,发现自己也就解决了“比大的小一点、比小的大一点”的随便拍脑袋即可搞定的事情,只不过是通过理论而已。所谓“大道”,读者或许也发现,结果看似一样,实际完全两个境界,小乘和大乘的差距就在于,前者是解决了一个件事,而后者是解决了一个领域的问题。数据指导业务,有非常艰难的冷启动阶段,可能费了很大的力气,才刚刚到达起点的拍脑袋即可搞定的水平,然而未来无可限量。所以现在那么多的CTO都号称“数据基础工作是无需评效益,优先级永远最高的”,这一方面是因为流行时尚(CTO其实比CMO更时尚,只是方式不同),另一方面,如果按照短期利益来评优先,费那么大的劲可能还短期赶不上拍脑袋的效率和效果,数据基础设施的投入或许是永远不值得做的。大致就这样了,谢谢能阅读到这里的朋友们,欢迎各种形式交流讨论。
爱文字爱数据的互联网产品运营,毕业于相辉堂草坪,10年电商从业经验,历经2家上市网站,3个创业团队,玩过外企/内资,桌面/移动,目前在上海的OTA,顺便带娃
//我所经历的大数据平台发展史(三):互联网时代 o 上篇http://www.infoq.com/cn/articles/the-development-history-of-big-data-platform-paet02 编者按:本文是松子(李博源)的大数据平台发展史...
高级钳工应知鉴定题库(858题) ***单选题*** 1. 000003难易程度:较难知识范围:相关4 01答案:C 由于量块的制造、线纹尺的刻线所引起的测量误差属于()误差。 A.计量器具B.测量方法C.标准器D.环境 2. 000004难易程度:简单知识范围:相关4 0...
《大数据时代下的统计学》杨轶莘(编著)中国工信出版集团+电子工业出版社 2015年9月第1版 ISBN 978-7-121-26936-3 博文金融 在《大不列颠百科全书》中统计学定义如下:收集、分析、表达和解释数据的艺术和科学。(p1-2) Stanley Smith S...
从小到大,一年总要参加几次婚礼,心情也会随着年纪增长逐渐变化:先是只顾着好吃的,边开心的等着红包;然后有祝福的意愿了,真心祝福新郎新娘永浴爱河;再开始感动羡慕,什么时候自己也可以找到想要结婚的人白头到老;接着代入回忆,这一步我们结婚的时候有没有?我怎么想不太起来我们结果时候...
每个人心中都藏着一个美好的初恋,在若干年后,即便是物已逝,人已非,那个人还会在你记忆最深的角落,熠熠发光,不可磨灭。
我相信那个女孩定是上天为我派下的天使,不为相爱,不为长久,只为在那短暂的几年,为我播下爱的种子,教会我爱的存在。
我相信那女孩恐怕是早已忘...
我没想过要变得多强大,我只希望自己成为那种人,不管经历过多少不平,有过多少伤痛,都舒展着眉头过日子,内心丰盛安宁,性格澄澈豁达。偶尔矫情却不矫揉造作,毒舌却不尖酸刻薄,不怨天尤人,不苦大仇深。对每个人真诚,对每件事热忱,相信这世上的一切都会慢慢好起来。
大家知道二战期间,作为轴心国中的王牌德军在1945年4月至五月可谓是挣扎到了终点,在希特勒自杀后,苏军最终占领德国柏林,这也意味着纳粹德国的覆灭,但尽管德国投降,日本却还硬着头皮做最后的挣扎,7月份,在粉碎德国后,美英苏在柏林发表对日本的最后通牒,也就是《波兹坦公告》,但日...
秦岭渭河蕴要枢,千年古邑六朝都,百般尊誉万札书。 汉武挥鞭成霸业,秦皇执戟创宏图,唐宗武曌世惊殊。 (日西安公干,一直对十朝古都充满向往,却没有游览,只好感怀历史。)当前位置: >>
实验数据的误差分析
第1章 分析测试中的误差分析测量值的准确度和精密度 提高分析结果准确度的方法偏差的有关计算 误差分析测定方法准确度的评价随机误差的正态分布 误差的传递数据的修约和运算11.1测量值的准确度和精密度知识目标1.掌握误差的分类、特点及来源 2.掌握准确度与精密度的概念、表示方法及其关系 3.知识公差、分析空白及其意义能力目标1.能正确判断误差的种类、来源。 2.能正确地表示准确度与精密度 3.能正确地判断分析结果是否超差。2在定量分析测试中,一般以数据的形式提供结果。获得数 1.1测量值的准确度和精密度 据要经过一系列步骤,如采样、称量、溶样、用仪器测量、用 标准物建立校正曲线以及运算等过程中的各步骤都会影响最终 结果的质量,包括数据的准确性和精密性、可比性。任何精细的实验工作都不可能不带入误差,即使使用最准 确的方法,使用最精密的仪器,由技术最高超的人员操作,也 不可避免会产生误差。误差(error)是指测定值和真实值之差。E ? x ?Tx>TE>0 正误差x<TE< 0 负误差一、误差的种类、特点和来源测定方法、测定过程和被测样品是分析测定的三大要 素,也是分析结果的主要误差来源。 例如,用AgNO3沉淀Cl-的称量法,作为分析方法由 于AgCl沉淀的溶解,对分析结果产生一个固定的负偏差 (大约在1.3×10-5mol/L)。 分析过程所用仪器示值的可靠性、仪器的稳定性、试 剂的纯度、容器材料的纯度及清洁度均可能给分析结果带 来误差。 实验环境条件如气温、气压、湿度、空气的微粒等也 可能影响仪器性能或影响被测样品或二者兼有;4误差的种类、特点和来源分析者的经验与操作技术直接影响分析结果的可靠性;取样 方式与取样过程、样品处理过程中的损失或玷污以及被测组 分在样品中的分布情况,往往成为分析结果的主要误差来源。 此外,数据的数字舍入和可疑值的取舍也可能引入误差。误差据误差的性质 和来源,分为系统 误差随机误 差(偶然 误差)5误差的种类、特点和来源1.系统误差 系统误差又称可测误差、恒定误差,它是由分析测试中 某些固定因素引起,在重复测定时会重复出现,因此它的正 负、大小有一定规律。在通用的标准方法中,通常系统误差 减小到很小甚至可忽略的程度。(1)特点它对分析结果的影响比较固定,其突出的特点是:单向性:它对分析结果的影响比较固定,可使测定结果系统偏高或系统偏低。重复性:当重复测定时,它会重复测定。6系统误差可测性:一般说来,产生误差的具体原因都是可以找到的,因而也就能够设法加以测定。(2)系统误差产生原因 a 方法误差 由于分析方法本身不准确或不完善造成的。如在 重量分析中,沉淀的溶解、共沉淀现象、灼烧时沉淀 的分解与挥发等;滴定分析中,反应进行不完全、干 扰离子的影响、化学计量点和滴定终点不一致以及发 生副反应等,都会系统地导致测定结果偏高或偏低。7系统误差例如:称量法测定Ca2+ Ca2++C2O42- =CaC2O4 CaC2O4 CaO+CO2 称量式CaO易于吸潮,因此称量时要产生一定的误差。 b 仪器误差 仪器本身的缺限或不够精确造成的误差。如砝码质量、容量 器皿刻度和仪表刻度不准确等。 c 试剂误差 分析测试中所用试剂本身不纯引起的误差d 主观误差又称个人误差,分析者个人生理或习惯上的原因造成的。如 对颜色不敏感、滴定管读数偏高或偏低。8系统误差的种类系统误差变动性 恒定的 系统误 系统误 差 差 恒定性系统误差一般是分析方法、分析过程和仪 器固有的系统误差,可用理论模型或与其它不同原理 的方法比较测定,从而估计固有系统误差的大小和方 向。 变动性系统误差实际上是随机化的系统误差,可 按随机误差处理。92.随机误差随机误差也称不定误差,不可测误差或偶 然误差。 该类误差是由于一些难以控制和避免的偶 然因素造成的。如分析过程中室温、湿度、气 压的微小波动;仪器性能的微小变化(如电源 电压波动引起光源强度的波动,仪器零点漂移) 等;分析人员对各份试样处理时微小差别或一 时辨别的差异而使读数一致等。10随机误差有界性 单峰性在特定条件下,有限次测定值中, 其误差的绝对值不超过某一界限。 绝对值小的误差出现的频率大 绝对值大的误差出现的频率小 测定次数足够多时,绝对值相等的正 误差和负误差的出现频率大致相等。 在一定条件下,对同一量进行测定,偶然误 差的算术平均值随测量次数增多而趋于零特 点对称性补偿性11随机误差产生原因随机的、难以预料和控 制的因素共同作用引起的。随机误差服从统计规律 大小相等的正负误差出 现的几率相等 小误差出现的几率大, 大误差出现的几率小。-误差发生的相对频率+ 误差12误差的种类、特点和来源3.操作错误 又称过失误差、粗大误差、粗差,是分析测试过 程中由于操作不正确、工作上粗心大意所造成的误差。 如器皿未洗洁、加错试剂、看错砝码、读错刻度值、 记录错误等。 分析测定中,不管造成的原因如何,一旦确实知 道存在操作错误,就应将含过失误差的数据舍掉。克服过失误差的途径是对分析测试人员进行敬岗 责任心的教育,培养严谨负责的工作作风及加强技术 学习和培训。13误差的种类、特点和来源例1 分析测试中出现下列情况,属于随机误差的是: A 滴定时所加试剂含有微量的被测组分B 某分析人员几次读取同一滴定管的读数不能取得 一致C 某分析人员读取滴定管的读数总是偏高或偏低 D 甲乙两人用同样的方法测定某一试样,但结果总 不能一致E 某分析人员从试剂柜中直接取出基准物Na2CO3来 标定HCl标准滴定溶液14误差的种类、特点和来源例2 分析过程中出现下列情况将引起什么性质的误差? A 砝码被腐蚀 B 称量时试样吸收了少量水分 C 读取滴定管读数时,最后一位数字估测不准 D 称量过程中,天平零点稍有变动。E 在称量分析中待测组分沉淀不完全F 试剂中含有少量待测组分15二、准确度与精密度1. 准确度(accuracy) 分析结果的可靠性用准确度来衡量。准确度 是指测定结果与“真值”接近的程度。 准确度用误差表示。E ? x ?TE越大,准确度越低;E越小,准确度越高。 误差分绝对误差(Ea)和相对误差(Er)16绝对误差(Ea)绝对误差的数值并不能准确表达测量值的准确度, 常用于说明仪器的精度。 例如,称取两个试样的质量: m1= 1.6372g T1= 1.6381 m2 = 0.1629g T2 = 0.1638g则 E1=1.1=-0.0009(g) E2= 0.8=-0.0009(g) 显然需要引入相对误差17相对误差(Er)绝对误差在真值中所占的比例Ea E r ? RE ? T上例中Ea RE % ? ? 100 TEa RE ‰= ? 1000 T? 0.0009 RE 1 % ? ? 100 ? ?0.55 1.6381 ? 0.0009 RE 2 % ? ? 100 ? ?5.5 0.1638说明前者较后者准确18相对误差(Er)例: 滴定的体积误差 V滴定剂体积应为20~30mLEaEr20.00 mL2.00 mL 称量误差? 0.02 mL? 0.02 mL? 0.1%? 1%称样质量应大于0.2gm0.2000 gEa? 0.2 mgEr? 0.1%0.0200 g? 0.2 mg? 1%19真值真值(样品中某一组分的含量必须有一个客观存在的 真实数值)实际上无法知道,只能近似知道。 实际知道的真值: 理论真值:如三角形内角之和为1800约定真值:由国际计量组织定义的单位,包括基本单 位、辅助单位及导出单位。相对真值:标准物质、标准量对低一级量提供的相对 真值。标准参考物质的证书上所给出的数值是相对真值。 测量就是拿待测之量直接或间接地与另一同类的已知 量相比较,把这个已知量定作标准单位或标准量,定出被 测之量与标准单位或标准量之间的比值。202 精密度(precision)在相同条件下,对同一试样多次重复测定值相互符合 的程度,即测定值(测定结果)相互接近的程度。精密度用偏差表示,偏差越大,精度越低;偏差越小, 精密度越高。 精密度说明分析结果的重现性和再现性。 重现性(repeatability) 是指同一操作者在同一实验室用同一方法对同一试样 在正常和正确的分析操作下进行多次分析所得结果的一致 性。21精密度(precision)再现性(reproducibility)是指不同操作者,在不同的实验室,用同一方法对 同一试样在正常和正确的分析操作下进行多次分析所得 结果的一致性。 偏差(deviation)偏差是将个别测定结果与n次重复测定结果的平均 值进行比较所得数值。d i ? xi ? X22偏差绝对偏差与 相对偏差 平均偏差与 相对平均偏差偏差标准偏差与 变异系数233.准确度与精密度的关系(1)正确度(correctness)正确度反映系统误差的大小,是在一定条件下所 有系统误差的综合。精密度好,正确度不好精密度不好,正确度不好精密度好,正确度好正确度与精密度的关系24准确度与精密度的关系(2)准确度 准确度反映了系统误差和随机误差的综合,表示 了测定结果与真值的一致程度。 如图所示,A、B、C三个测定都无系统误差,则 A、B、C的正确度 是相当的。 其准确度从高到低 依次为A、B、C。无系统误差的试验25准确度与精密度的关系如图所示,A′、B′、C′ 都有系统误差,且对应同一 真值,则其精度依次降低, 由于的系统误差,它们是不 准确的。 如果考虑到精度因素, A′的大部分试验值可能比上 图中B和C的试验结果要准确。有系统误差的试验26准确度与精密度的关系定量分析中,系统误差主要影响测定的准确度,随 机误差主要影响测定结果的精密度。准确度与精密是判断 测定结果好坏的依据。但测定结果的精密度并不能说明测 定值与真值的关系。精密度是测定结果的重复性,准确度 表示测定结果的正确性。二者既有区别又有联系。 总之,精密度是保证准确度的基础,即保证准确度 的必要条件(只有在精密度比较高的前提下,才能保证分 析结果的可靠性)而不是充分条件,精密度好准确度不一 定准确度高。27准确度与精密度的关系x1x2x3x41.精密度是保证准确度的先决条件 2.精密度好,不一定准确度高.28小结: 1.误差的种类、来源、特点。 2.准确度与精密度的概念、表征及相互关系。作业: P94 1 229三、公差准确度与精密度是两个不同的概念,但常常被混 淆。准确度用误差表示,误差以真值为比较的标准; 精密度用偏差表示,偏差以多次测定结果的平均值为 比较标准。事实上无法获得真值,常以平均值代替真 值进行计算,本质上仍是偏差。这时绝对误差(Ea)和 绝对偏差、相对误差(Er)和相对偏差也混为一谈。在一些部门和一些方法标准中,为避免纠缠误差 与偏差,提出采用公差的概念,即根据实际需要和实 际可能,提出一个误差的允许范围。30公差公差是生产部门对分析结果所能允许误差的一种 表示方法。或者说,是指按此方法进行多次测定所得 的一系列数据中最大值与最小值允许界限即极差。如 果分析结果超过允许的公差范围,称为“超差”,该 项分析应该重做。 公差范围的确定,一般要考虑生产需要和实际可 能两个方面。它与下列因素有关: 1.对分析工作的要求 生产实践和科学试验,对分析结果准确度的要求 情况不同。31公差2.样品组成 样品组成越复杂,进行某一项分析时遇到的干扰 可能越多,分析操作手续也会繁琐复杂,引起误差的 可能性越大,允许误差范围就宽一些。对于某些简单 物质的分析允许公差范围往往要严一些。 例如:分析测定Ba2+对于BaCl2样品的测定,其要求是不一样的。重晶石32公差3.试样中被测组分的含量测定高组分含量,允许相对误差要小一些,测定 低组分含量时,允许相对误差要大一些。如果样品中 被测组分的含量在80-99%,公差范围RE%在3-4%; 含量在0.001-0.01%,RE%在100-50%。4.方法的准确度各分析方法所能达到的准确度不同,允许公差范 围也不一样。例如,国标《钢铁化学分析标准方法》 中规定测定S%的公差:33公差如果试样含硫量在0.02-0.05%,平行测定两次, 两次分析结果之差不越过规定公差±0.004的二倍,即 ±0.008时,分析符合要求。34公差分类分室内允许差和室间允许差1.室内允许差在同一实验室内,用同一种分析方法,对同一试 样,独立地进行两次分析,所得两次分析结果之间在 95%Z信度下可允许的最大差值。如果两个分析结果 之差的绝对值不超过相应的允许误差,则认为室内的 分析精度达到了要求,可取两个分析结果的平均值报 出;否则,即为超差,认为其中至少有一个分析结果 不准确。35公差分类用氯化铵重量法测定水泥熟料中的二氧化硅含量 国家标准规定SiO2允许差范围为0.15%,若实际测得数值为23.56%和23.34%,其差值为0.22%,必须重新测定。如果再测得数据为23.48%,与23.56%的差值为 0.08%,小于允许误差,则测得数据有效,可以取 其平均值23.52%作为测定结果。36公差分类室间允许差两个实验室,采用同一种分析方法,对同 一试样各自独立地进行分析时,所得两个平均 值之间在95%Z信度下可允许的最大差值。两 个结果的平均值之差符合允许差规定,则认为 两个实验室的分析精度达到了要求;否则就叫 做超差,认为其中至少有一个平均值不准确。37四、分析空白“空白”就其广义而言,包括:样品的玷污(正空 白)、样品的损失(负空白)和仪器噪声水平。在痕量 组分分析(组分含量<0.001%)与超痕量分析中最容易 出现样品的玷污。样品玷污产生的空白叫做分析空白。 分析空白对痕量分析结果的准确度、精密度和方法 检测下限起着决定性的作用。 分析空白的来源1.环境对样品的玷污主要是由于空气中的污染气体和沉降微粒引起的, 这些微粒中含有多种元素,因而引起多种痕量元素的玷 污。38分析空白2.试剂对试样的玷污试剂对试样的玷污随着试剂用量而变化。对一定 试剂用量是恒定的,样品处理过程中使用最多的是水 和酸,因此采用高纯水、酸和减少试剂用量是降低试 剂空白的主要措施。3.器皿对样品的玷污贮存、处理样品所用一切器皿如杯子、瓶子、研 钵等,由于其材质不够纯或未洗净,均可能玷污样品。39分析空白4.分析者对样品的玷污 分析人员用手触摸样品可能引起多种元素的污染, 分析者的化妆品常常不知不觉地带来许多元素的污染, 分析者不注意个人卫生也会引起样品的玷污。所以分 析人员不但要有正确熟练的操作技能,而且要知道自 身对样品可能带来什么样的玷污,以采取消除玷污的 必要措施。401.2 偏差的有关计算知识目标1.知道平均值的种类 2.掌握偏差的有关概念能力目标能利用相关公式正确地计算各种偏差411.2 偏差的有关计算在分析测试工作中最重要的是标准偏差(standard deviation;SD或S)和相对标准偏差(relative standard deviation; RSD ),对于次数较少的平行测定(一般3-4 次)用平均偏差或相对平均偏差表示精密度。一、绝对偏差与相对偏差d i ? xi ? Xdi % ? di??? 100 ?xi ? X??d i 与d i %有正负之分? 100XX42偏差的有关计算平均值(mean) 平均值可综合反映测定值在一定条件下的一般水平,分析 测试中将多次测定值的平均值作为真值的近似值。 (1)算术平均值x1 ? x2 ? ? ? xn 1 x? ? n n(2)加权平均值?xi ?1ni分析测定值是用不同方法或不同分析人员得到的,则测 定数据中不同值的精度或可靠性不一致,为突出可靠性高的 数值43偏差的有关计算则可采用加权平均值。?1 x1 ? ? 2 x2 ? ? ? ? n xn x? ? ? ?1 ? ? 2 ? ? ? ? n?? xi ?1 nni i??i ?1i(3)对数平均值 如果试验数据的分布曲线具有对称特性,可用对数平均值。x1 ? x 2 x1 ? x 2 x2 ? x1 xL ? ? ? x1 x2 ln x1 ? ln x2 ln ln x2 x144偏差的有关计算两数的对数平均值总小于或等于它们的算术平均值。 如果 x1 1 ? ?2 2 x2时,可用算术平均值代替对数平均值(此时误差小于 4.4%)。 (4)几何平均值 当一组测定值取对数后所得数据的分布曲线更加对 称时,则采用几何平均值。一组试验值的几何平均值 常小于其算术平均值。45偏差的有关计算xG ? n x1 x2 ? xn ? ( x1 x2 ? xn两边取对数lg xG ?1 )n? lg xi ?1nin(5)调和平均值不同平均值都有各自的用途,选用哪种求平均值的方法 取决于试验数据本身的特点,如分布类型、可靠性程度 等。46偏差的有关计算二、平均偏差与相对平均偏差 设一组测量数据为x1,x2,x3,…,xn,则其算术平 均值为: n ? ? 1 1 n X ? ( x1 ? x2 ? ? ? xn ) ? ? xi ? n X ? ? xi n n i ?1 i ?1 各单次测量值与平均值的偏差为: d1 ? x1 ? x d 2 ? x2 ? x ?? dn ?xn ?x47偏差的有关计算很明显,在这些偏差中,一部分是正偏差,一部分是 负偏差,还有一些可能为零。如果将单次测量值的偏 差相加,则? d ? ? (xi ?1 inn?di ?1ni ?1ii? X ) ? ? xi ? n X? ??n?i ?1? nX?nX ? 0可见单次测量结果的偏差之和等于零,即不能用偏差 之和来表示一组分析结果的精密度。因此需要引入平 均偏差。48偏差的有关计算? | d1 | ? | d 2 | ? ? ? | d n | 1 n 1 n d? ? ? | d i |? ? | xi ? X | n n i ?1 n i ?1 ?d%????d??100或d ‰ ?-d??1000XX49偏差的有关计算例1甲组 乙组比较同一样品的两组平行测定值的精度10.3 10.0 9.8 9.5 9.6 10.2 10.2 9.9 10.1 9.8 10.4 10.5 10.0 9.7 9.7 10.2 9.7 10.110.4 9.9解:1 10 X 甲 = ? xi ? 10.0 n i ?1??1 10 X 乙 = ? xi ? 10.0 n i ?1??d甲1 10 ? ? | d i |? 0.24 10 i ?1d乙1 10 ? ? | d i |? 0.24 10 i ?150偏差的有关计算则它们的相对平均偏差: 仅从 d 或 d % 因此仅从? ?0.24 d%? ? 100 ? 2.4 10.0?来看,两组数据的精度似乎没有差别, ? 表示测定结果的精度是不够的。 d 或 d% 平均偏差又称算术平均偏差,用来表示一组数据的精密度。 特点:简单; 缺点:大偏差得不到应有反映。51偏差的有关计算在数理统计中,已很少用 d ,除非该样本的容量较 小,只有少数数据时才使用平均偏差。 三、标准偏差与变异系数 1.总体与样本 在统计学中,研究对象的全体称为总体(或母体)。 对分析测试而言,在指定条件下,做无数多次平行测定所 得的无限多的数据的集合,称为总体。 自总体中随机抽出的一组测定值称为样本(或子样), 样本中所含测定值数目,叫样本容量,即样本的大小。?52偏差的有关计算2.差方和与方差 差方和:测量值对平均值的偏差的平方和,用Q表示Q ? ? ( xi ? X ) 2i ?1n?样本方差:是测量值对样本平均值的偏差的平方的平 均值,用S2表示? 1 2 2 S ? ? ( xi ? X ) n ? 1 i ?1 n53偏差的有关计算3.标准偏差 ? 设样本容量为n,则其平均值 X ? 1 ( x ? x ? ? ? x ) ? 1 n x ?i 1 2 nn ni ?1当测定次数无限增多时,所得平均值即为总体平均值 μ。1 ? ? lim ? xi n ?? n i ?1没有系统误差存在,n→∞ 则总体平均值就是真值。标准偏差又称均方根偏差。分两种情况:54n标准偏差(1)当测定次数趋于无穷大时 总体标准偏差: 1 n ?? ( xi ? ? ) 2 ? n i ?1(n ? ?)(2)有限测定次数 样本标准偏差:S ?( xi ? X ) 2 ?i ?1n?n-1为自由度,通常是指独立变数的个数。对于一组n个 测量数据的样本,有n个偏差,但它们并不都是独立的,n ?155标准偏差因为n个偏差之和为零,某个偏差均可由另外n-1个偏 差计算出来,因此,对于一组n个测量数据的样本,其 偏差的自由度为n-1个。S ? ( xi ? X ) 2 ?i ?1 n ?n ?1?在公式中引入n-1的目的,主要是为了校正以 X 代替μ所产生的误差。 当测量次数非常多时,测量次数n与自由度n-1的区 ? 别就很小, X ? ?56标准偏差此时( xi ? X ) 2 ? limi ?1 n ??n?同时S ??n ?1? lim( xi ? ? ) 2 ?i ?1nn ??nRSD % ?S?? 100相对标准偏差(变异系数)X标准偏差常用于衡量数据的波动性。由于在计算标准 偏差时,是把单次测量值的偏差先平方再总和起来, 避免各次测量偏差相加时正负抵消,因而能更好地反 映出数据的分散程度。57标准偏差如例1中,两组数据的标准偏差S甲=0.28S 乙=0.23X 、d i 和? d i2?可见,甲组数据的精度比乙组数据好。 计算标准偏差时,可以按照公式先求出?再计算S,但比较麻烦,而且在计算 X 时,由于最后 一位数字的取舍,可能带来一些误差。因此,将公式 稍加变形,以便直接根据各测量值计算S。( x ? X )2 ? ? ( x2 ? 2x X ? X 2 ) ? ? x2 ? ????(? x) 2 n58标准偏差S ??x2 i? (? xi ) / n2n ?1目前使用该公式利用电子计算器计算比较方便。 (“STAD”, + on )输入一个数据后,按 DATA 2ndf 键,全部数据输入后,按相应的键,可直接显示X 、S、??等数值。59标准偏差例2 标定某溶液浓度的四次结果为:0.2041、 0.2039 、0.3mol.L-1,计算其标定结果的 平均值、平均偏差、相对平均偏差、标准偏差和相对 标准偏差。解:?1 n 02041 ? 0.2049 ? 0.2039 ? 0.2043 X ? ? xi ? ? 0.2043(mol.L?1 ) n i ?1 4?1 n | ?0.0002 | ? | 0.0006 | ? | ?0.0004 | ? | 0.0000 | d ? ? | d i |? n i ?1 4 ? 0.0003(mol.L?1 ) ? ? d 0.0003 d % ? ? ? 100 ? ? 100 ? 0.15 0.2043 X60标准偏差( xi ? X ) 2 ?i ?1 n ?S?n ?1?0.0002 2 ? 0.0006 2 ? 0.0004 2 ? 0. ?1=0.0004(mol.L?1 )0.0004 RSD % ? ? ? 100 ? ? 100 ? 0.2 0.2043 Xs61标准偏差例3 分析铁矿石中铁含量,5次测定结果为37.45%、 37.20%、37.50%、37.30%和37.25%,计算此结果的 平均偏差、相对平均偏差、标准偏差和变异系数。解:1 n X ? ? xi ? 37.34% n i ?1?1 n | 0.11 | ? | ?0.14 | ? | 0.16 | ? | 0.04 | ? | ?0.09 | d ? ? | d i |? ? 0.11(%) n i ?1 5?62标准偏差0.11 d % ? ? ? 100 ? ? 100 ? 0.29 37.34 XS? ( xi ? X ) 2 ?i ?1 n ???dn ?1 =0.13 (%)?0.112 ? 0.0.14 2 ? 0.16 2 ? 0.09 2 ? 0.04 2 5 ?10.13 RSD % ? ? ? 100 ? ? 100 ? 3.5 37.34 X63s平均值的标准偏差4.平均值的标准偏差 在使用标准偏差时,应严格区分单次测量值的标准偏 差与平均值的标准偏差 S 。?X平均值的标准偏差反应若干组平行测定,各平均值之 间的离散程度。 - m个n次平行测定的平均值: ? - -X 1 、 2 、 3 ?X m X X统计学已证明,对有限次测定时:S S? ? n X 1 X 或 = S n S-同理 ? -=X?n64平均值的标准偏差表明:平均值的标准偏差与测定次数的平方根成反比, 增加测定次数可以提高测量的精度,但增加测定次数 的代价不一定能从减小误差得到补偿。 由 S X -n 作图:?S如图所示,开始时 X S 随n增加而减少很快, 但当n>5以后其变化 就慢了, n>10变化 很小。实际工作中测 定次数无需过多,5-6次已足够了。65S?偏差的有关计算四、极差 极差是指一组测定数据中最大值与最小值之差,它表示误 差的范围,所以又称为范围误差。 R=Xmax-Xmin 极差相对于测定平均值之比,称为相对极差, 可用百分比表示: R R % ? ? ? 100 X 极差可用来估算标准偏差,因而间接表示精度。测定次数 在15次以内时,S ? R C是与测定次数有关的统计因子, C 其数值见有关手册。统计因子的数值近似等于测定次数的 R 平方根,因此由极差估算S实际上采用近似式 S? n66偏差的有关计算例4 分析蛋白质样品中的蛋白质含量,共测定9次, 其结果分别为(%):35.10、34.86、34.92、35.36、 35.00、35.01、34.77、35.19和34.98,计算其测定结果 的平均值、相对平均偏差、变异系数和平均值的标准 偏差。 解:?1 n X ? ? xi ? 35.03% n i ?1??1 n d ? ? | d i |? 0.14(%) n i ?1?0.14 d % ? ? ? 100 ? ? 100 ? 0.4 35.03 X67d偏差的有关计算( xi ? X ) 2 ?i ?1 n ?S?n ?1? 0.18 (%)0.18 RSD % ? ? ? 100 ? ? 100 ? 0.5 35.03 XsS? ?XS n?0.18 9? 0.06068小结?公差及其意义 ?分析空白 ?平均偏差、相对平均偏差、标准偏差、变异系数 的有关计算。 ? S X? 与S的关系作业 P9523691.3 测定方法的评价一、测定方法的准确度(accuracy)由于真实值实际上是无法知道的,在实际工作中往往 用“标准值”代替真实值来检验一种分析方法的准确度。“标准值”是由不同实验室的许多经验丰富的分析人 员,用多种可靠的分析方法对同一试样经过大量重复测定 而得到的结果的平均值,因此是相当准确的结果,是现实 工作水平最接近真值的实测值(如原子量、物化常数、国 家标准局提供的标准样品数据),虽然从理论上讲标准值 并不等于真值,但实际应用中人们视作真值。70测定方法的准确度(accuracy)1.影响测定准确度的因素测定方法的准确度是由测定方法的原理、测定仪器和 测定条件所决定的。例如,用酸碱滴定法测定纯碱中Na2CO3的含量1 c( HCl ) ? V ( HCl ) ? M ( Na2 CO3 ) 2 ? ( Na2 CO3 )% ? ? 100 m可由下式估算测定的系统误差:?c 2 ?V 2 ?M 2 ?m 2 ( ) ?( ) ?( ) ?( ) ?( ) ? c V M m271??测定方法的准确度(accuracy)大多数分析方法是相对的,难以用上述方法估算 该分析方法的准确度,需要对分析方法的精密度、灵 敏度、仪器的稳定性、样品的均匀性、稳定性、代表 性以及干扰、回收率、分析空白和标准制备等进行全 面分析,并用标准物质或标准方法评价结果的准确度。 2.测定结果准确度的检验分析结果是否准确、可靠,这是很重要的问题, 也是比较难解决的问题。实际工作中常用以下方法予 以检查:72测定方法的准确度(1)平行法在相同的条件下,对同一试样做多次重复测定, 取其平均值。但应注意:平行测定的结果相符合,不 能说明结果一定准确。(2)求和法 对一个试样进行全分析,各组分质量分数之和应 接近100%。一般情况下,组成越简单,误差越小,各 组分质量之和越接近100%;组成较复杂,各组分质 量之和与100%相关较大。73测定方法的准确度例如,某硅酸盐的全分析结果为:74测定方法的准确度(3)离子平行法如果试样是电解质,则试样中正负离子的总电荷数相 等。例如,某溶液中含有Ca2+、Mg2+、Na+、K+、Cl-、 SO42-、HCO3-75测定方法的准确度(4)用不同类型的方法进行分析对同一试样用两种不同的分析方法去测定试样中 某些组分,然后比较其分析结果,如果结果之间没有 显著性差异,就可以认为结果是可靠的。这是检验分 析结果是否准确的一种常用的也是较好的方法。在检 验复杂物质中某些不常见的组分的测定结果更是简便 有效。例如,某试样中铁含量的测定,有称量法、 K2Cr2O7法、EDTA法、比色法、原子吸收光谱法等。76测定方法的准确度3.准确度的评价方法评价测定方法准确度常采用标准物质分析、回收率测 定、不同方法的比较。(1)标准物质分析 测定标准试样的含量,由所得结果来确定分析方法的 准确度。 EE ? xi ? xs或 Er % ?XS?100标准物质是一个或多个特征量已被准确地确定了的物 质。是由国家有关部门组织生产并由权威机构发给证书的 试样,如标准钢样、标准硅酸盐试样等。77测定方法的准确度(2)回收率试验在无标准试样又不宜用纯物质进行对照试验,或对试 样的组成不完全清楚时,则可采用加标回收法。这种方法是向试样中加入已知量的被测组分,然后用 与测定试样同样的方法进行对照试验,由分析结果中被测 组分的增大值,便可估计出分析的误差并对测定结果加以 校正。 回收率x0 ? 加入标准物质的量 x1 ? 加标试样测定值 x2 ? 试样测定值78x1 ? x2 p% ? ? 100 x0回收率试验例如,用光度法测定试样中汞的含量,用加标回收率 试验得到如下数据:加入Hg的量(μg) 0.0 2.0 4.0 6.0 8.0 测得Hg的量(μg) 10.0 11.9 14.2 16.1 17.9 回收率%95 105 102 9979回收率试验回收率在95~105%之间,符合光度法要求,所以方法 可靠。 进行加标回收率测定时应注意 ?加标物质的形态应与待测组分的形态相同。 ?加标量尽量与样品中待测组分含量相等或相近。 ?在任何情况下,加标量均不得大于待测组分含量的 三倍。 ?加标后的测定值不应超过该方法测定上限的90%。 ?当样品中待测组分含量接近方法检出限时,加标量 应控制在校正曲线的低浓度范围。80准确度的评价方法(3)不同方法的比较 当用不同方法对同一试样进行重复测定时,如果 所得结果一致,或经统计处理表明其差异不显著时, 则可认可这些方法都具有较好的准确度。在通常情况 下,以被公认的方法为最可靠的方法。 二、测定方法的精度测定方法的精度与样品的均匀性、被测量值的大 小、所用仪器、试剂、实验人员、实验环境条件和测 定次数有关。81测定方法的精度1.连续测定的精度在相同条件下,同一时间内对同一样品进行n次 重复测定,得到测定值 x1、x2、x3 ?? xn ,当n是很大 的数字时,单次测定的标准偏差??? 1 n ( xi ? X ) 2 ? n i ?1在一般情况下,测定次数n是有限的,用σ的估计 ? n 值S表达精度。 2S ?? (xi ?1i? X)n ?182测定方法的精度2.重复性精度在相同的条件下,不同时间内对同一样品进行m回 n次重复测定,测得:x11x12x13 ??x1nSx1s1 ? nx 21x 22……x23 ??x 2 nSx……2s2 ? nsm ? n83x m1x m2xm3 ??x mnS xm测定方法的精度可得到个m平均值 的标准偏差? ?x1x2x 3 ?? x m??及其平均值Sx1SX2S X ??S X3m则 Sr ??sm2 i用以表示测量方法的重复性精度。 3.再现性精度在不同的条件下对相同样品进行重复测定。不同条件是指 影响测定结果的全部因素或其中一个因素发生变化。一个 实验室在影响因素发生变化的情况下,用所研究的方法对 相同样品进行m回n次重复测定,或者由m个实验室用同 一方法分别对相同样品进行n次重复测定。843.再现性精度对于m回n次重复测定数据算出相同条件下的重复性精度m 出总体标准偏差Sr ?si2 由m个平均值及总体平均值用下式计算 ?s ??( xi ? X ) 2 ?i ?1n再现性反映了分析方法对测定条件的敏感性,可用于评 价分析方法在不同条件下再现分析结果的能力;从多个实验室 进行合作实验的角度来看,再现性反映了不同实验室测定条件 的变化,可用于评价一个实验室再现其它实验室结果的能力。851 式中 X ? ? xi mxm ?1三、测定方法的灵敏度测定方法的灵敏度一般用工作曲线的斜率 y ? ax ? b 表示,a越大,灵敏度越高; a值受测定条件的影响。研究测 定方法灵敏度的目的就是为了选择提高灵敏度的最佳条件,控 制好最佳条件以便减少a值的波动。 测定方法的灵敏度它表示该方法所能检出的某组分的最低 值,此值越小,其灵敏度越高。 许多分析人员也惯用最小检出量或者检出下限表示灵敏度。 一般而言,高灵敏度的分析方法,精度也高。灵敏度的稳定性 不但影响测定方法的精度,而且还能引起系统误差,只有灵敏 度固定不变时,测得的物理信号(光、电等参数)才与被测样 品的浓度(含量)建立定量关系。86测定方法的灵敏度检测限 某一分析方法在给定的可靠程度内可以从样品中 检测待测物的最小浓度或最小量,称为检测限。所谓 检测是指定性检测,即断定样品中确定存在有浓度高 于空白的待测物质。 检测限的几种规定:(1)分光光度法中规定以扣除空白值后,吸光 度为0.01相对应的浓度值为检测限。(2)气相色谱法中规定检测器产生的响应信号87测定方法的灵敏度为噪声值2倍时的量。最小检测浓度是指最小检测量与进样量 (体积)之比。(3)离子选择性电极法规定某一方法的标准曲线的直线部 分外延的延长线与通过空白电位且平行于浓度轴的直线相交时, 其交点所对应的浓度值即为检测限。 (4)对于未规定的分析方法,其检测限一般采用下述 方法求得。 CL-方法检出限 3S B SB-平行11次空白试验值的标准偏差 C L? a a-工作曲线的斜率88测定方法的灵敏度例如,采用某一方法测定水样中Hg(Ⅱ)含量,其工作曲 线为y = 0.0207x - 0.0257,平行测定11次空白值的标准 偏差为SB=0.001,则该方法的检测限为:3S B 3 ? 0.001 C L? ? ? 0.16 a 0.0207检测上限是指校正曲线直线部分的最高点(弯曲点)相应 浓度值。89测定方法的灵敏度测定限 测定限分测定下限和测定上限。测定下限是指在测定误差能 满足预定要求的前提下,用特定方法能够准确地定量测定待测物 质的最小浓度或量;测定上限是指在限定误差能满足预定要求的 前提下,用特定方法能够准确定量测定待测物质的最大浓度或量。 最佳测定范围又称为有效测定范围,是指在限定误差能够 满足预定要求的前提下,特定方法的测定下限到测定上限之间的 浓度范围。 方法运用范围是指某一特定方法检测下限至上限之间的浓度 范围。显然,最佳测定范围应小于方法适用范围。90小结测定结果准确度的检验与评价方法。 测定方法的准确度、精度和灵敏度。 检测限与测定限911.4提高分析结果准确度的方法一、分析化学中对准确度的要求 不同目的的化学分析,所要求的准确度不同。例 如,相对原子质量的测定,准确度要求很高,允许差 应低于10-4~10-5;勘探测定矿石和土壤中重金属, ±50%的准确度就可以满足要求,一般科研和生产分 析中准确度的要求与试样中组分的含量有关。92分析化学中对准确度的要求有关控制生产方面的分析,要求报出结果快,对准 确度的要求低,但在分析标准试样时,要求准确度较高。 另外,各种分析方法的准确度和灵敏度不相同。如 称量分析和滴定分析法的准确度较高,在中等和高含量 组分的测定中,其相对误差不大于0.2%。由于其灵敏 度不高,这两种方法一般不适合低含量(<1%)的测 定。因此,分析测定应根据具体情况和对分析准确度的 要求选择合适的分析方法、制定分析方案。93二、提高分析结果准确度的措施从误差产生的原因来看,只有绝对避免发生过时 误差(即在操作、读数、记录、计算等环节不发生错 误),尽可能减小系统误差和随机误差,才能提高测 定结果的准确度。 1.选择适当的分析方法例如,对于Ba2+的测定,至于选用何种方法,应 根据试样的组成, Ba2+的含量以及方法准确度的要求, 选择合适的方法。94提高分析结果准确度的措施EDTA返滴定法比浊法Ba2+BaSO4重量法 BaCrO4重量法重量法碘量法AAS法95提高分析结果准确度的措施2.减小测量误差 为保证分析结果准确,必须尽量减小测量误差。 如称取试样时要求m≥0.2g 滴定时消耗标液体积要求V≥20mL应注意:对于不同的分析方法,测量的准确度只 要与方法的准确度相适应就行了。 如比色分析测定微量组分,要求RE%≤2,若称 取试样0.5g时,则其称量的绝对误差不大于0.5×2% ≤0.01g就行,如果强调称准至0.0001g,说明操作者对 误差尚未理解相对误差的概念。96提高分析结果准确度的措施3.增加平行测定次数 在消除系统误差的前提下,增加测定次数,可减 小随机误差,但测定次数过大得不偿失。一般分析要 求平行测定3-4次,对准确度要求较高的分析测定5-6 次,最多一般不大于10次。 4.消除测定过程中的系统误差系统误差来源于分析方法、仪器、试剂以及分析 人员本身。消除测定过程中的系统误差应根据产生的 不同原因,采用不同的方法加以校正和检定。97提高分析结果准确度的措施(1)对照试验 该法用校正方法误差。? 试样与标样对照 ?拟定方法与标准方法对照 ?由不同分析人员或请外单位分析人员进行对照 ?已知标准物质加入法 采用加入法作对照 。即称取等量试样两份,在一份试样中加入已知量的待测组分, 平行进行此两份试样的测定,由加入被测组分量是否 完全回收来判断有无系统误差。98提高分析结果准确度的措施若对照试验说明有系统误差存在,则应设法找出产生 系统误差的原因,并加以消除。 (2)回收试验 在无标准试样又不宜用纯物质进行对照试验,或 对试样的组成不完全清楚时,则可采用加标回收法。 (3)空白试验(4)校正仪器(5)分析方法的校正99三、滴定分析法误差的减小和消除1.方法误差的减小和消除100三、滴定分析法误差的减小和消除2.仪器误差的减小与消除101三、滴定分析法误差的减小和消除3.试剂误差的减小和消除102三、滴定分析法误差的减小和消除4.操作误差的减小和消除 (1)滴定条件掌握不当造成的误差103三、滴定分析法误差的减小和消除(2)称量操作误差104操作误差的减小和消除(3)操作者的不良习惯或操作不规范造成的误差105小结 提高测定结果准确度的基本方法 滴定分析误差的消除和减免方法 作业 P9471061.5 测量值的正态分布由于系统误差可以测量和校正,因此对于实验中 出现的系统误差,关键在于找到产生的具体原因,以 便消除其影响。本节主要讨论不能测量也不能消除的 随机误差,讨论有关随机误差的理论和方法。这种讨 论是在假定不存在系统误差的前提下,或是在消除系 统误差的前提下进行的。当然,实际测量中系统误差 和随机误差同时存在,这里假定系统误差不存在是为 了讨论问题单纯化。107测量值的正态分布一、频率分布为研究随机误差的规律,先看实例。108测量值的正态分布表中113个数据,为某班学生在相同下用滴定分析 法测定工业纯碱中Na2CO3的含量,这些测定是彼此独 立,属于随机变量。 从这些数据可以看出,有大有小,似乎杂乱无章, 也就是说,测量数据具有分散性的特点。如果细致观 察,发现位于中间数值74.70~75.10的数据多一些,在 其它范围内的数据少一些,小到73.40或大到78.00附 近的数据更少,这就是说,数据具有明著的集中趋势。 测量数据的这种既分散又集中的特性,就是其规律性。109测量值的正态分布将上表中113个数据从小到大进行分组,设定每 组的宽度组距 ?x ? 0.4 ,为避免同一数据横跨两组 的现象,将每组的边界值比实际测量值多取一位有效 数字。将上述数据分成13个组。110测量值的正态分布1.基本概念 (1)频数: 每个组中数据出现的个数。 (2)频率:对于随机事件A,若在n次实验中出现了m(ni) 次, m(ni)与n之比值称为随机事件A发生的频率。 简单地说,就是频数除以数据总数。 (3)频率密度:频数与组距 ?x (组中最大值与最小值之 ni m 差)的比值( 或 ) 频数分布表:将数据按大小顺序排列反映各组频数的统计 表。111m ni ? ( A) ? ? n n0 ? ? ?1n?xn?x频率分布频数分布表可以把大量原始数据综合起来,以较直观、 形象的形式表示分布的情况,并为作图提供依据。112频率分布2.频率分布直方图 从上表知:原来似乎杂乱无章的数据经过整理后已经 表现出某种规律性,其中最突出的特点是:随着测定次数 由小到大的变化,频率密度由小到大,在达到最大值后又 由大到小,而频率密度最大值的哪几个组又恰好是平均值 所在的组。以测量值为横坐标,频率密度为纵坐标作频度 直方图。 直方图是通过对数据的加工整理,从而分析和掌握测 定数据的分布情况的一种方法。将全部数据分成若干组, 以组距为底边,以该组距相应的频数或频率密度为高按比 例而构成的若干矩形,即为直方图。113频率分布直方图114频率分布直方图绘制直方图的基本步骤:(1)作频数分布表搜集数据:将测定数据填入数据表,作直 方图的数 据要求 >50 计算极差: 适当分组: 确定组距: 绘制频率分布表115频率分布直方图组距的确定要适当,组数太少会掩盖各组内的变 化情况且会引入较大的计算误差;组数太多则会造成 各组的高度参差不齐,反而难以看清数据的分布情 况 ,并且计算工作量大。组数的确定一般为: 数据数目50~100 100~250 250以上 分为6-10组 分为7-12组 分为10-20组极差 组距一般以 组数确定78.17 ? 73.30 ? 0.397 ? 0.4 上例中组距 13116频率分布直方图(2)画直方图 ?先画纵坐标 纵坐标表示频数或频率密度,定纵坐标刻度时考虑的 原则是:把频数中最大值定在适当的高度。如上例中频数 最大为36,作图取40.?横坐标表示测量值 值都应在坐标值内。?在图上标图名。定刻度时要同时考虑最大、最小?以组距为底,频数或频率密度为高,画出各组的直方。117频率分布直方图从直方图中看出:全部测量数据是分散的,但又有明显的集中趋 势。不仅随测量次数的增加,频率密度由小→大,再由大→小, 测量值在平均值附近的频率比远离平均值的频率高得多,或者说 测量值在平均值附近出现的次数比远离平均值出现的次数多得多。118频率分布直方图(3)直方图的观察分析直方图能够比较形象、直观地反映测量数据的分 布情况。观察的方法是:对图形的形状进行观察,并 对照公差进行比较。看图形应眼于直方图的整个形状,实战中画出的 图形常见一些参差不齐的形状,不必太计较。常见的 直方图典型形状有: ①正常形:又称对称形,它的特点是中间高,两 边低,呈左右基本对称,说明测量正常。119频率分布直方图② 孤岛形 在远离主分布中心的地方出现小的直方, 形如孤岛。孤岛的存在揭示在测定过程中有异常因 素在起作用,使测定条件发生了变化。③偏向形直方的顶峰偏向一侧,也称为偏坡形。120频率分布直方图④双峰形 往往是由于把来自两个总体的分析数 据混在一起作用所致。⑤平顶形 直方呈平顶形往往是由于测定过程中有 缓慢变化的因素在起作用。121频率分布直方图⑥断齿形 这类直方图大量呈出参差不齐,但整个 图形的整体看起来还是中间高,两边低,左右基本对 称,造成的原因不是分析上的问题,可能是分组过多 或测量仪器精度不够,读数有误差等原因所致。122频率分布直方图从上例数据实例看出:测量数据并不象初看起来那样杂乱 无章,而是服从统计规律。 统计规律:是指哪些从少量数据中看不出规律,而只有通 过对大量数据的分析和比较才能看出的规律。 如果设想,测定次数不断增加,分组越细,则上述图形的 形状将趋于一条平滑的曲线。123频率分布直方图这条曲线反映了数据的分布规律。实践证明:分析数 据的分布曲线的形状如上图平滑曲线的最多,称为正 态分布曲线。 二、正态分布 1.分布函数 大量不含系统误差的测量数据,各个测量值出现的概 率密度分布,可以由正态分布概率密度函数来表示, 正态分布也称高斯分布(Gauss),其数学表达式为 高斯方程。124正态分布y ? f ( x) ? 1? 2?e?( x ? ? )2 2? 2x 表示测量值,y 为测量值出现的概率密度正态分布的两个重要参数:μ 为无限次测量的总体均值,表示无限个数据的集中趋势 (无系统误差时即视为真值)σ 是总体标准差,表示数据的离散程度。x -μ为偶然误差f (x) 表示x出现的概率密度,也相当于某一组内测量值出现的 ni m 频率密度n?x或n?x125正态分布概率:随着试验次数n的无限增大,随机事件A的频率稳定于一 个常数P,这个常数P就是频率的极值,在一定意义上称这个极 限值为随机事件A的概率。ni P( A) ? lim n ?? n这里的概率可以理解为:在无限多次测量中,测量值 ni x在某一范围内出现的频率,即 n→∞时的 ; n 概率密度可以理解为:在无限多次测量中,分组的组距为无限 小时,测量值x出现的概率密度,即n→∞时的ni m 或 n?x n?x126正态分布2.正态分布曲线-N (μ ,σ2 )曲线 正态分布曲线是高斯方程的形象化表示,它直观地表 明了在同一总体的无限多次测量中各种可能的测量值 的分布情况。 y: 概率密度 x: 测量值 μ: 总体平均值 x-μ: 随机误差 σ : 总体标准差127正态分布? 、 不同,代表不同的正态分布,如果σ值相同(等精度测 ? 量),μ值不同( ?1< ? 2 ),曲线的形状相同,只是曲线沿横轴平移。N(μ1 ,σ2)、N(μ2 ,σ2)maxy?1f(x)?2?1 ? ? 2?1 ?20???< ? 2 ?2 11128x正态分布如果 ? 值相同, σ值不同( ? 1 < ? 2)曲线的形 状不同。从上两图中可以看出正态分布曲线的特点: (1)共性 不论它们曲线的形状和位Z有什么不同, 它们都具有: ?单峰性:即随着测量值x的增大,概率密度y总是由 小→大,再由大→小,而在 x = μ 处出现极大值, 表现为一个峰形,而x在 μ 附近出现的概率密度 最大,而远离μ的区域出现的概率密度最小,说 明测量值具有明显的向总体平均值μ集中的趋势, 也就是说大部分测量值集中在算术平均值附近。129正态分布?有界性:在没有系统误差存在时,总体平均值 ? 一般就是真值。 当x →∞或∞时,曲线渐进x 轴,小误差出现的几率大,大误差出现的 几率小,极大误差出现的几率极小。 ?对称性: 曲线以x =μ的直线为对称→正负误差 出现的概率相等。130正态分布(2) 和? 对曲线形状的影响 ?正态分布曲线的形状和位Z受? 和? 值大小的影响。? 相同时, 越小,曲线瘦高,表明数据越集中; ? ? 越大,曲线矮胖,表明数据越分散。可见, 的大小代 ?表测量数据的分散程度。当不同实验室或不同分析人员 ? 分析同一个“真值”样品时,由于标准偏差 值不同, Gauss函数的“展宽”和“峰离”不同,但真值仍然保 持相同。 简单地说: σ↑,y↓, 数据分散,曲线平坦。131正态分布? 相同, ? 不同,曲线的形状不变,只是左移或右移, ? ? 由于测量数据总是向 集中,所以 的大小代表测量数据的集中趋势。 简单地说: σ↓,y↑, 数据集中,曲线尖锐。? 和? 分别代表数据的集中趋势和分散程度,当 ? 和?确定后,正态分布曲线的形状和位Z就确定了,所以, 通常把正态分布记着 N (? ,? 2 )132正态分布3.样本值出现的概率不论σ为何值,分布曲线和坐标轴之间所夹的总 面积是各种大小偏差的样本值出现的概率的总和。任何样本值在区间 [a, b] 出现的概率 P(a ? x ? b) 等于横轴在 x ? a, x ? b 区间曲线和坐标轴之间所夹 面积 ( x?? )2P(a ? x ? b) ? ? f ( x)dx ? ?abb1a? 2?e2? 2dx?1? 2??b( x?? )2ae2? 2dx133正态分布式中1? 2?f ( x)在 ? ? ? x ? ?P ( a ? x ? b) ? ? 1 ? ? 2?b a为归一化因子,它保证概率密度 区间的定积分为11 f ( x)dx ? ? e -? ? 2? dx ? 1?? ( x?? )2 2? 2dx???( x?? )2-?e2? 2总之,测量值都落在-∞~+∞,总概率为1134随机误差的规律定性:1.小误差出现的概率大, 大误差出现的概率 小, 特大误差概率极小; 2.正、负误差出现的概率相等. 定量:某段曲线下的面积则为概率.135小结:?频数、频率和频率密度等基本概念。? 频率分布直方图及其应用。 ?高斯分布函数与正态分布曲线的特点。136三、标准正态分布正态分布曲线随 ? 和? 取值不同而不同,应用起 来极不方便。为了便于用积分法求出误差(或测量值) 区间概率,需要横坐标作一些数学上的处理,即误差 表示方法不用x Cμ表示,而是以标准偏差 ? 的倍 数表示。 x??令u ?1 2?y ? f ( x) ??e? ( x ? ? )2 2? 2??1? 2?eu2 ? 2如果对u?x???取微商,则有:137标准正态分布又dx ? ? ? du ? f ( x)dx ?? (u ) ?11 2?u2 ? e 2 du? ? (u )du即某测量值x和与其对应的u在它们各自的微小区域内 出现的概率相同。 ?u 2? 2?e?u2 2y ? ? (u ) ?1则 ? (u ) 是曲线的纵坐标 ,u是曲线的横坐标,绘制了不同u 值时的概率密度 ? (u )1382?e2标准正态分布从形式上看,标准正态分布本身与 ? 和? 的大小完全无关,也可以说是与? ? 0, ? ? 1 的正态分布完全相同, ? ? x )所以 ( ? ? 0, ? ? 1标准正态分布又记作 N (0,12 ) 曲线的形状与 ? 值无关,不论分 布曲线是陡峭的还是平坦的,都 得到相同的标准分布曲线。标准正态分布曲线139。四、随机误差的区间概率标准正态分布曲线的纵坐标为概率密度,概率密度 乘以误差的某区间,表示这一区间的误差出现的概 率,也就是说:偶然误差的区间概率P用一定区间 的积分面积表示该范围内测量值出现的概率。 因此,曲线下面的面积表示为全部误差的概率总和, 显然,从-∞~+∞,所有测量值出现的总概率P为 1 ,即?????? (u ) ? du ? ???1 2????eu2 ? 2du ?1140随机误差的区间概率而单峰的总面积S=0.5,当u不是从-∞~+∞ 而由某区间构成,可由上式积分求得面积u2 ? 2p??ba? (u ) ? du ?? u2 du 2?b1 2?a?edu ys?1 2??u0e当 u ? 1 时, s ? 0.341141随机误差的区间概率当? 1 ? u ? ?1x??测量值x出现在? ??( u??得x ? ? ? u?1 2?)的区间概率是:p(?1 ? u ? 1) ??e?11u2 ? 2du ? 0.683即测量值出现在( ? ? ? , ? ? ? )区间的概率为 68.3%。同样,求得测量值在其它区间的概率。142随机误差的区间概率随机误差的区间概率随机误差u出现的区间 (以σ 为单位) 测量值出现的区间 概 率p(-1, +1) (-1.96,+1.96) (-2, +2) (-2.58, +2.58) (-3, +3)(μ-1σ, μ+1σ) (μ-1.96σ, μ+1.96σ) (μ-2σ, μ+2σ) (μ-2.58σ, μ+2.58σ) (μ-3σ, μ+3σ)68.3% 95.0% 95.5% 99.0% 99.7%143随机误差的区间概率0.4 0.3 0.2 0.1 0 -4-3? -2? -? ?-3? ?-2? ?-?-3-2-10?68.3% 95.5% 99.7%0? 2? 3? ?+? ?+2? ?+3?1234x-? xu144正态分布概率积分表145随机误差的区间概率从上表知,在一组测定值中,偏差大于两 倍标准偏差的测定值出现的概率小于5%(1- 0.955),即平均20次测定中最多只有一次机会; 偏差大于三倍标准偏差的测定值出现的概率更 小,平均1000次测定中只有3次机会。一般化 学分析出现这样大偏差的测定值是不大可能的。146例题例1 分别求测量值在真值正负两个和三个标准偏差范 围内出现的概率。x?? x ? ? ? u? 解:由定义 u ? 得 ? 1? 时,u ? 1 查积分表知单侧面积为 0.3413,所以 ? ?内概率为0..26%? ? 外的概率为1-68.32=31.74%3? 时 u ? 3 查得面积为0.4987 故 ? 3? 时内的概率为0..74%? 3? 外时的概率为0.26%147例题例2 经过无数次分析(假定系统误差已消除),测得 某铜矿中铜的含量50.60%,其标准偏差为0.10%,试 求测量值落在50.40~50.80%的概率为多少? 50.40 ? 50.60 解: x=50.40%时, u? ? ?2 x?? 0.10 u? 50.80 ? 50.60 x=50.80%时, ? u? ?2 0.10查表得相应的概率为:0..955结果表明,测量值落在50.40~50.80%的概率为95.5%。148例题例3 对含铁的试样进行了200次分析,已知结果符合正态 分布N(55.20,0.202),求分析结果大于55.60%的最多可能 出现的次数。 解:u?x???55.60 ? 55.20 ? ?2 0.20查正态分布表得:P=0.4773 故200次中分析结果大于 55.60%的概率为0.3=2.27%,则可能出现的次数 为: 2.27%×200≈5(次) 本题是单侧区间问题,对于双侧如u ? ?2149例题即测量值落在该区间的概率为:0.4773×2,测量 值落在该区间外的概率为:1-0..0454; 则可能出现的次数为: 0. ≈ 9次 例4 某标准样品中含Co的标准值为1.75%, σ= 0.10%,求分析结果在1.60~1.80%范围内出现的概率。解:左边界x=1.60%时,u?x???1.60 ? 1.75 ? ? ?1.5 0.20150例题u 查表10-3, | u |? 1.5 时,P1=0.4332 据对称性, 在 0~-1.5范围内的概率为43.32%右边界x=1.80%时u?x???1.80 ? 1.75 ? ? 0.5 0.20查表得 | u |? 0.5 时,P2=0.1915,即u 在0~0.5范围内 的概率为19.15% 所以测量值在1.60~1.80%范围内出现的概率为:P=P1+P2=0.5=62.47%151例题例:已知某试样中Co的百分含量的标准值为1.75%, σ=0.10%,又已知测量时无系统误差,求分析结果落在 (1.75±0.15)% 范围内的概率和分析结果大于2.0% 的概 率。 x?? x ? 1.75 %解:u?????0.15 % ? 1.5 0.10 %查表 ? P ? 2 ? 0.4332 ? 0.8664 ? 86.64%落在该区间的概率为86. 64%(2.00 ? 1.75)% u ? ? ? 2.5 ? 0.10 % 查表可知, 当u从0 ~ 2.5时, P ? 0.4938 ? 49.38%? 分析结果大于 2.0%的概率为P' ? 50.00% ? 49.38% ? 0.62%152x??小结: ? 标准正态分布及其特点。 ? 随机误差的区间概率。作业: P95 5 61531.6 数据的修约和运算在分析工作中,不仅要准确地进行测量,还应正确地 记录和计算,当用数值表示分析结果时: ? 要反映出测量值的大小 ? 要反映出测量值的准确度通常用有效数字来表示或体现测定值的可信程度。例 如,称量法测定硅酸盐中 SiO2的含量:0.1374 ? 100 ? 30..4538这样的结果是不正确的。154有效数字1.有效数字 是指在分析工作中实际能测量到的数字,通常包 括全部准确数字和一位不确定的可疑数字。例如,用 万分之一天平准确称量物体的质量一点五克,则应记 录为1.5000g.除另有说明外,对有效数字的最后一位可疑数字, 一般可理解为:可能有±1个单位的绝对误差,所以, 测量值的有效数字与测量方法及所用仪器的准确度有 关。例如: 25.00mL试样的质量 0.g 1.9g测量的液体的体 25mL 积 250.0mL155有效数字确定有效数字的位数,零要作具体分析:(1)数字中间的零 (2) 数字前边的零 (3) 数字后边的零 都是有效数字 如 60.008 2.01805都不是有效数字 如 0. 一般都是有效数字 如 2.500 6.0180但需注意的是,对于整数末尾的零,其意义不甚明显, 如 2530000,可能为2.53×106、2.530×106、2.、 2.5、2.6 为避免混淆,在记录时,应 根据测量的精度将其写成幂的形式。156有效数字总之,数字零在数据中具有双重作用:(1)作普通数字用 0.5180 4位有效数字 5.180?10-1 (2)作定位用 如 0.0518 3位有效数字 5.18?10-22.确定有效数字时,应注意的几个问题 (1)记录测量数据时,只允许保留一位可疑数字 如万分之一天平称量 0.3258g 台称称量 0.3g 滴 定管体积 21.09mL (2)有效数字与小数点位Z或量的单位无关157有效数字例如 称得某试样的质量为2.5g 若以mg为单位 2.5×103 若以kg为单位 2.5×10-3(3) 若有效数字第一位大于或等于8,有效数字的位 数可多计一位,如8.72 9.38 等可视为四位有效数字(4)在所有计算式中,常数(如π、e)、倍数、 分数、乘除因子(如 等)等有效数字位数是无限 的,在计算时需要几位就取几位。158有效数字例如 用盐酸标准滴定溶液滴定混合碱以测定总碱度时(5)在pH、 pKa、pM中,有效数字的位数与其真 数的有效数字位数相同, 如 pH=3.0 , [H+]=1×10-3(mol? -1) ; 若 L [H+]=1.0×10-6(mol? -1) 则pH=6.00 L159有效数字(6)表示测量精度时,标准偏差在一般情况下最多 只取两位有效数字 (7)误差只需保留1~2位; (8)化学平衡计算中, 结果一般为两位有效数字 (由于K值一般为两位有效数字); (9)常量分析法一般为4 位有效数字(Er≈0.1%), 微量分析为2~3位.160有效数字二、数字修约规则舍去多余数字的过程,叫做“数字修约” 或数字整化。数字修约所遵循的规则称为数字 修约规则,按“四舍六入五单双”的原则,即 执行GB? 1.1-81附录《数字修约规则》。161有效数字162有效数字注意:当对标准偏差修约时,修约后会使 标准偏差结果变差,从而提高可信度。例:s = 0.134 → 修约至0.14,可信 度↑163有效数字三、有效数字的运算规则 在处理分析数据时,常遇到一些准确度不同的数据, 为了减少计算中的错误,使计算结果更加符合实际测定的 准确度,在进行运算时应遵循下列规则: 1.加减法运算 几个数相加或相减时,它们的和或差 的有效数字位数以小数点后位数最少(绝对误差最大)的 为准。 例1 0.+1.0435 解法一: 0.+1.6 →26.70 解法二: 0.+1.+25.64+1.04=26.69164有效数字例2 5.007-1.解法一:5.007-1.=2.解法二:5.007-1.=5.01-1.00-1.05=2.96 例3 333.2 +4.578 +2.×10-3解法一:333.2 +4.578 +2.×10-3 =333.2 +4.578 +2.2=340.3402 →340.3 解法二:333.2 +4.578 +2.×10-3 =333.2 +4.6+2.6-0.0=340.4165有效数字2.乘除法运算几个数相乘或相除时,它们的积或商的有效数字 位数,以参与运算中有效数字位数最少(相对误差最 大)的为准。166有效数字3.乘方和开方运算 对测量值进行乘方或开方运算时,原数字有几位有 效数字就可保留几位有效数字。167有效数字应注意: (1)四则混合运算中,为避免误差的叠加,在 最终确定以前的各步,有效数字可多保留一位,最后 结果再取回原位。(2)计算四个以上数的平均值时,平均值的有 效数字可多取一位。168有效数字(3)无论哪种运算,计算结果的精度取决于测量 值最差的哪个原始数据的精度。若V(HCl)=7.80 mL 是不相同的。V(HCl)=20.00mL 则结果的位数169四、有效数字在分析中的应用1.正确地记录测量数据 实验过程中常遇到的两类数字(1)数目:如测定次数;倍数;系数;分数 (2)测量值或计算值。数据的位数与测定准确度有关。 记录的数字不仅表示数量的大小,而且要正确地反映测 量的精确程度。 结果 绝对偏差 相对偏差 有效数字位数0.518000.±0.00001±0.0001 ±0.001±0.002%±0.02% ±0.2%54 3170有效数字在分析中的应用注意(1)容量器皿;滴定管;移液管;容量瓶;4位有效 数字 (2)分析天平(万分之一)取4位有效数字 (3)标准溶液的浓度,用4位有效数字表示:0.1000 mol/L171有效数字在分析中的应用2.正确地选用量和选用适当的仪器例如 若称取试样质量2~3克,就不需要万分之一的天 平,用千分之一的天平即可?0.002 ? ? 100 ? ?0.1% 2.00由此可知,没有万分之一的天平同样可以做分析实验, 解决办法是将样品的质量称取在1克以上即可。172有效数字3.正确地表示分析结果 例如 分析煤中含硫量时,称取试样3.5g,甲乙两人的 结果为 甲(S%) 0.042 0.041 乙(S%) 0.99应采用甲的结果,因为:? 0.001 甲: ?100 ? ?2% 0.041而称样的准确度:? 0.0001 乙: ?100 ? ?0.02% 0.04201? 0.1 ? 100 ? ?3% 3.5173小结 1.有效数字的意义及在分析中的应用 2.数字修约规则 3.有效数字的有关运算 作业 P94 P96 3 151741.7 误差的传递在定量分析中,很多结果都是要求做多种方式的测量, 然后将这些直接测定值代入一定公式,再计算出结果。例如, 用HCl标准滴定溶液滴定混合碱以测定总碱度:1 M ( Na2 CO3 ) 可以视为真值外,其余都有各自的误 式中除 2 差,它们都反映到最后结果上。计算公式不同,误差的传递175误差的传递方式也不同,而系统误差和随机误差也以不同的方式 传递到分析结果中去。 一、系统误差的传递 例如,溶液中溶质的量为n(B),为溶液浓度和体 积的乘积 n(B)=c(B)VB , 如果直接测量值浓度的误差 为△c,而体积V的系统误差为 ?V 则间接测量值n的 系统误差为 ?n 则有:n ? ?n ? (c ? ?c)(V ? ?V ) ? cV ? c?V ? V?c ? ?c?V ? ?n ? c?V ? V?c ? ?c?V 两边同除以cV176系统误差的传递?n ?V ?c ?V ?c ? ? ? n V c V c当测量值的相对误差都较小时,即?V ?c ?c ?V 远远小于1, 远远小于1, ? 也远远小于1, 可忽略不计 V c c V ?n ?V ?c 则有: ? ? n V c通常用微积分的形式表示系统误差,即:dn dV dc ? ? n V c177系统误差的传递1.加减法运算 若分析结果的计算式 R=k1A+k2B-k3c , 式中 k1、 k2、k3为没有误差的常数,则分析结果的绝对误差或 偏差为:dR ? k1dA ? k 2 dB ? K 3 dcdR dA dB dc ? k1 ? k2 ? k3 相对误差为: R A B C 例1 设有三个测量数据+0.50、+4.10、+1.97,它们的系统误差分别为+0.02、-0.03、-0.05,计算公式为R= A+B-C,求计算结果的绝对误差和相对误差。178系统误差的传递解:绝对误差 dR ? dA ? dB ? dC ? 0.02 ? (?0.03) ? (?0.05) ? ?0.04 相对误差dR dA dB dc ? 0.02 (?0.03) (?0.05) ? ? ? ? ? ? ? 0.06 R A B C 0.50 4.10 1.97为什么不能这样计算? R=A+B-C=0.50+4.10-1.97=2.63dR ? 0.04 ? ? 0.015 R 2.63加减法一般计算绝对误差。179系统误差的传递2.乘除法运算若分析结果的计算式为:则dR dA dB dC ? ? ? R A B CAB R? C分析结果的误差或偏差是各步骤相对误差或偏 差的代数和。 例2 称取0.6091g试样溶解后,用容量瓶稀释至 100.0mL,称样的系统误差为+0.0006g,容量瓶体积 的系统误差为-0.10mL,求溶液的质量浓度。180系统误差的传递解:mB 0.6091 ?B ? ? ? 6.091( g / L) ?3 V 100.0 ?10 d? dm dV ? 0.0006 (?0.10) ? ? ?[ ? ] ? ?0.1% ?B m V 0.实际浓度? B ? 0.6091? (1 ? 0.1%) ? 0.6092( g / L)例3 欲配制0.1000mol.L-1K2Cr2O7 标液,称取 4.O7 基准试剂溶解后定溶成1升。称量完毕后发现 天平零点变到-0.5mg处,而容量瓶的校正值为-0.20mL,问配 制K2Cr2O7标液浓度的相对误差、绝对误差和真实浓度是多少?181系统误差的传递解:1 c( K 2 Cr2 O7 ) ? 6 m( K 2 Cr2 O7 ) 1 M ( K 2 Cr2 O7 )V ( K 2 Cr2 O7 ) 6dc dm dV ? ? ? 而dm ? ?0.5mg dV ? ?0.20mL C m V dc ? 0.5 0.20 ? ? ? ?0.0001 ? ?0.1‰ c 4.00.0绝对误差 dc=-0.1‰×0.1000=-0.00001(mol.L-1) K2Cr2O7的真实浓度为:1 c( K 2Cr2O7 ) ? 0.1000 ? 0.00001 ? 0.09999mol.L?1 6182二、随机误差的传递对于任意一测量值 R ? f ( A, B, C ??) A B C , 为独立变量,测量A、 B 、C等数值时的标准偏差会反映 到R的标准偏差中,其大小按下式计算。??R ? A? B ?C1.加减法:则有s ?s ?s ?s2 R 2 A 2 B2 C即分析结果的标准偏差的平方是各测量值标准偏差的 平方和。 2.乘除法:AB R? C2 2 2 sR 2 s A sB sC 则有 ( ) ? 2 ? 2 ? 2 R A B C183随机误差的传递即 例4sR ? R2 2 2 sC sA sB ? 2 ? 2 2 A B C求下列结果的标准偏差( A ? B) ? D 型,可先求出加减 解:该题是 R? C 运算中的标准偏差[(14.3 ? 0.2) ? (11.6 ? 0.2)] ? (50.0 ? 0.1) R? ? 3.2 ? S R 42.3 ? 0.4(14.3 ? 0.2) ? (11.6 ? 0.2) ? 2.7 ? s1 s ? 0.2 ? 0.22 1 2 2? s1 ? ?0.3184随机误差的传递原式化为(2.7 ? 0.3) ? (50.0 ? 0.1) R? ? 3.2 ? sR 42.3 ? 0.42 2 2SR 0.3 0.1 0.4 ? ? ? ? ? 0.1 2 2 2 R 2.7 50.0 42.3 ? sR ? 0.1R ? 0.1? 3.2 ? 0.3185随机误差的传递3.指数或根式运算若分析结果R ? kAn n ?1? dR ? nkA dAn ?1dR nkA dA dA ? ?n n R A kA表明在指数运算中,结果的相对偏差为测定值的相对 偏差乘以指数。186随机误差的传递例5 卤化银的溶度积常数为 (4.0 ? 0.4) ?10?8 求其 溶解度。 解:Ag+ + x- = AgX↓ 则溶解度为:s ? (4.0 ? 0.4) ? 10 ? (2.0 ? s R ) ? 10 S R 1 0.4 ? ? ? 0.05 s R ? 2.0 ? 0.05 ? 10 ?4 ? 0.1? 10 ?4 S 2 4.0故 溶解度?8?4s R ? (2.0 ? 0.1) ? 10?4187随机误差的传递4.对数运算若 R=logA 则有ln A ln A R? ? ? 0.434 ln A ln 10 2.3 dA dR ? 0.434 A表明测量值的相对偏差乘以0.434就得支结果的标准偏差。 例6R ? log[( 2.00 ? 0.02) ?10?1 ] ? (?2.699 ? sR )求 sR ? ?188随机误差的传递解:0.02 s R ? 0.434 ? ? 0.004 2.00 ? R=( ? 2.699 ? 0.004 )189极值误差的传递3、极值误差(1)Y ? k ? k a A ? kb B ? kc C, ? Ymax ? k a? A ? kb? B ? kc? CAB ( Y? 2) , C?YY??AA??BB??CC190极值误差的传递例 滴定管的初读数为(0.05 ± 0.01) mL, 末读数为 (22.10 ± 0.01) mL, 问滴定剂的体积可能在多大范围内波动?解:极值误差 滴定剂体积为: ?V = 0.01 + 0.01 = 0.02(22.10-0.05)? 0.02 = (22.05 ? 0.02) mL191三、误差传递在分析中的应用1.称量分析法 在称量分析中,被测组分的质量分数计算式为:S? 2 S m沉 2 S m 样 2 ( ) ?( )? ( ) ? m沉 m样为减小被测组分含量数值的误差,称量误差必须尽可能地小, 而称量值(无论是沉淀还是试样的质量)都应该足够大。192误差传递在分析中的应用2.滴定分析 在滴定分析中,被测组分的质量分数:c( B)VB M ( A) ? ( A)% ? ?100 则有 m 2 2 2 S? SC SV Sm ? ? 2 ? 2 2 S c V m 要使测量值很小,右端每项的值都应尽可能小。如果滴定 剂的相对误差 SC S 2 < .1% 0 则( C ) 可以忽略不计。c c S2 S2 ? = V ? m ? V 2 m2 S?193误差传递在分析中的应用如果采用50mL滴定管,其标准偏差小于0.05mL,SV 则 可以保持得相当低,称取合适的试样m,使V VSV ? 0.1% 于是测定结果 在35~45mL范围内,这样 V的偏差实际上等于称量的相对偏差。例6 设天平称量时的标准偏差 s = 0.10mg,求称量 试样时的标准偏差sm。194误差传递在分析中的应用解::? m ? m1 ? m2 , ?? s m ? s ? s ? 2s ? 0.14mg2 1 2 2 2例7 用AgCl称量法测定氯时,称取试样0.2000克,最后得AgCl↓0.2500克,考虑天平称量时的标准偏差s=0.1mg,计算分析结果的标准偏差。195例题解:试样中氯含量 m沉 m沉 M(cl ) ? (cl )% ? ? F ? 100= ? ? 100 m样 m样 M ( AgCl )0. ? ? ? 100 ? 30.92 0. S m样 2 S沉 2 S Cl 2 [ ] ?( )? ( ) ? (Cl ) m沉 m样则有称试样时,分析天平读取两次平衡点,则有2 S m 样 = S1 ?S2= 2 S 2196例题称取沉淀时,分析天平读取四次平衡点,则有Sm沉= S ?S ?S ? S =2 S2 1 2 2 2 3 2 4S 沉 2 Sm样 2 (2s ) 2 ( 2 s ) 2 SCl 2 [ ] ?( )? ( ) ? 2 ? 2 ? (Cl ) m沉 m样 m沉 m样 4 ? 0.1?10 ) ( ?10 ) ( 0.1 = ?2 = 1% 2 2 0.0-3 2 -3 2? SCl ? 1% ? (30.92%) ? 1%2197例题例8 用移液管移取HCl溶液25.00mL,用 0.1000mol? -1NaOH标准溶液滴定,用去30.00mL。已 L 知移液管移取溶液时的标准偏差为S1=0.02mL,读取 滴定管读数的标准偏差为S2= 0.01mL。求标定HCl溶 液时的标准偏差。 解:因是乘除法的偶然误差,所以有:198例题? S NaOH ? Sx ? ? ? c( HCl ) ? ? ? V ? ? ? ? ? NaOH2? ? S HCl ? ?? ? ?V ? ? HCl2? ? ? ?2因滴定时读两次数,而移液时只读一次数,所以S HCl ? S1 ? 0.02? Sx ? ? ? c( HCl ) ? ? ? ?2S NaOH ? 2S 222 ? 2 ? 0.01 ? 0.02 ? ?7 ? ? ?? ?? ? ? ? 8.8 ? 10 ? ? 25.00 ? ? 30.00 ?S x ? 0.1200 ? 8.8 ? 10 ?7 ? 1.1 ? 10 ?4 mol? ( L-1)199小结: 1.系统误差和随机误差的传递公式及有关计算。 2.误差传递在分析中的应用。 作业: P94 8200
更多搜索:
All rights reserved Powered by
文档资料库内容来自网络,如有侵犯请联系客服。