仪器信息网APP
选仪器、听讲座、看资讯

【原创】分析化学中的数据处理

  • 省部重点实验室
    2010/12/07
  • 私聊

分析化学

  • 分析化学中的数据处理

    1.总体与样本

    总体:在统计学中,对于所考察的对象的全体,称为总体(或母体)。

    个体:组成总体的每个单元。

    样本(子样):自总体中随机抽取的一组测量值(自总体中随机抽取的一部分个体)。

    样本容量:样品中所包含个体的数目,用n表示。

    例题:

    分析延河水总硬度,依照取样规则,从延河取来供分析用2000ml样品水,这2000ml样品水是供分析用的总体,如果从样品水中取出20个试样进行平行分析,得到20个分析结果,则这组分析结果就是延河样品水的一个随机样本,样本容量为20。

    2.随机变量

    来自同一总体的无限多个测量值都是随机出现的,叫随机变量。

    (总体平均值), (单次测量的平均偏差)



    一、 标准偏差



    1总体标准偏差(无限次测量)

    n-测量次数

    2样本标准偏差(有限次测量)

    n1)-自由度

    3相对标准偏差

    相对标准偏差(变异系数)



    4标准偏差与平均偏差

    当测定次数非常多(n大于20)时, ,但是

    5平均值的标准偏差

    统计学可证明 平均值的标准偏差与单次测量结果的标准偏差存在下列关系:


    增加测定次数,可使平均值的标准偏差减少,但测定次数增加到一定程度时,这种减少作用不明显,因此在实际工作中,一般平行测定3-4次即可;当要求较高时,可适当增加平行测量次数
    (无限次测量)

    (有限次测量)

    二、 随机误差的正态分布



    1频数分布

    频数:每组中数据的个数。

    相对频数:频数在总测定次数中所占的分数。

    频数分布直方图:以各组分区间为底,相对频数为高做成的一排矩形。

    特点:

    1. 离散特性:测定值在平均值周围波动。波动的程度用总体标准偏差s表示。

    2. 集中趋势:向平均值集中。用总体平均值m表示。在确认消除了系统误差的前提下,总体平均值就是真值。

    2正态分布(无限次测量)

    1.正态分布曲线:如果以x-m(随机误差)为横坐标,曲线最高点横坐标为0,这时表示的是随机误差的正态分布曲线。

    记为:Nms2),

    m-决定曲线在X轴的位置

    s-决定曲线的形状,s®曲线高、陡峭,精密度好;s®曲线低、平坦,精密度差。

    随机误差符合正态分布:(1)

    (1)大误差出现的几率小,小误差出现的几率大;

    (2)绝对值相等的正负误差出现的几率相等;

    (3)误差为零的测量值出现的几率最大。

    (4)x=m时的概率密度为

    2.标准正态分布N01



    3随机误差的区间概率

    所有测量值出现的概率总和应为1,即

    求变量在某区间出现的概率,

    概率积分表,p248。注意:表中列出的是单侧概率,求±u间的概率,需乘以2

    随机误差出现的区间 测量值出现的区间 概率

    u±1 xm±1s 0.3413×268.26

    u±2 xm±2s 0.4773×295.46

    u±3 xm±3s 0.4987×299.74

    结论

    1.随机误差超过3s的测量值出现的概率仅占0.3%

    2.当实际工作中,如果重复测量中,个别数据误差的绝对值大于3s,则这些测量值可舍去。

    <>例:已知某试样中Fe的标准值为3.78%s=0.10,又已知测量时没有系统误差,

    1)分析结果落在(3.78±0.20%范围内的概率;2)分析结果大于4.0%的概率。

    解:1 查表,求得概率为2*0.4773=0.9546 =95.46%

    2)分析结果大于4.0%的概率, 查表求得分析结果落在3.78-4.00%以内的概率为0.4861,那么分析结果大于4.00%的概率为0.5000-0.4861=1.39%
    +关注 私聊
  • 省部重点实验室

    第1楼2010/12/07

    三、 少量数据的统计处理



    1 t分布曲线(有限次测量中随机误差服从t分布)

    有限次测量,用S代替s,用t代替u

    置信度(P):表示的是测定值落在 范围内的概率,当f®¥t即为u

    显著性水平(a=1-P:表示测定值落在 范围之外的概率。

    t值与置信度及自由度有关,一般表示为 p250,表73(双侧表)

    2 平均值的置信区间

    意义:表示在一定的置信度下,以平均值为中心,包括总体平均值m的范围。

    从公式可知只要选定置信度P,根据P(或a)与f即可从表中查出taf值,从测定的 sn值就可以求出相应的置信区间。

    <>分析某固体废物中铁含量得如下结果: =15.78%s=0.03%n=4,求

    1)置信度为95%时平均值的置信区间;2)置信度为99%时平均值的置信区间

    解:置信度为95%,查表得t0.053=3.18,那么

    置信度为99%,查表得t0.053=5.84,那么

    对上例结果的理解:

    1.正确的理解:在15.78±0.05%的区间内,包括总体平均值的m的概率为95%。

    2.错误的理解:a.未来测定的实验平均值有95%落入15.78±0.05%区间内

    b.真值落在15.78±0.05%区间内的概率为95%

    从该例可以看出,置信度越高,置信区间越大。

    3显著性检验

    判断是否存在系统误差。

    t检验:不知道s,检验

    1)比较平均值与标准值,统计量 ss t>t,有显著差异,否则无。

    2)比较

    F检验:比较精密度,即方差S1S2F表为单侧表

    统计量 F>F,有显著差异,否则无。

    <>一碱灰试样,用两种方法测得其中Na2CO3结果如下

    方法1 方法2

    解:先用F检验s1s2有无显著差异:

    查表7-4,得F=6.59,因F计算< F表,因此 s1s2无显著差异

    t检验法检验

    查表7-3f=5+4-2=7P=95%得:t=2.36 ,则 t计算< t表,因此,无显著差异。

    4 异常值的取舍

    1. 法(简单,但误差大)

    依据:随机误差超过3s的测量值出现的概率是很小的,仅占0.3%d=0.80s,3s»4d

    偏差超过4d的个别测定值可以舍去。

    方法:a. 求出 与平均偏差 ,则测定值x可以舍去。

    2.格鲁布斯(Grubbs)法

    步骤:(1)数据由小到大排列,求出 sx1x2……xn

    (2) 统计量T (x1为可疑值) xn为可疑值)

    (3)T与表值Ta,n比较,T>Ta,n,舍去。

    3Q检验法

    步骤:(1)数据由小到大排列。

    2)计算统计量

    3比较Q计算Q表(QPn,若Q计算>Q,舍去,反之保留。

    <1011>分别用三种检验法来判断1.40这个数据是否应该保留。

    四、误差的传递

    分析结果通常是经过一系列测量步骤之后获得的,其中每一步骤的测量误差都会反映到分析结果中去。设分析结果Y 由测量值A、B、C 计算获得,测量值的系统误差分别为DADBDC,标准偏差分别为sA、sB、sC。ki为常数。

    1 系统误差的传递

    1.加减法 2.乘除法

    3.指数关系 4.对数关系

    2 随机误差的传递

    1.加减法 2.乘除法

    3.指数关系 4.对数关系

    3 极值误差

0
    +关注 私聊
  • 省部重点实验室

    第2楼2010/12/07

    五、 回归分析法

    1 一元线性回归方程

    式中x,y分别为xy的平均值,a为直线的截矩,b为直线的斜率,它们的值确定之后,一元线性回归方程及回归直线就定了。

    2 相关系数

    相关系数的定义式如下:


    相关系数的物理意义如下:

    a.当所有的认值都在回归线上时,r= 1。

    b.当y与x之间完全不存在线性关系时,r=0。

    c.当r值在0至1之间时,表示例与x之间存在相关关系。r值愈接近1,线性关系就愈好。

    六、提高分析结果准确度的方法

    1 选择合适的分析方法

    (1) 根据试样的中待测组分的含量选择分析方法。高含量组分用滴定分析或重量分析法;低含量用仪器分析法。

    (2) 充分考虑试样中共存组分对测定的干扰, 采用适当的掩蔽或分离方法。

    (3) 对于痕量组分,分析方法的灵敏度不能满足分析的要求,可先定量富集后再进行测定

    2 减小测量误差

    称量:分析天平的称量误差为±0.0002g为了使测量时的相对误差在0.1%以下,试样质量必须在0.2 g以上。

    滴定管读数常有±0.0l mL的误差,在一次滴定中,读数两次,可能造成±0.02 mL的误差。为使测量时的相对误差小于0.1%,消耗滴定剂的体积必须在20 mL以上,最好使体积在25 mL左右,一般在20至30mL之间。

    微量组分的光度测定中,可将称量的准确度提高约一个数量级。

    3 减小随机误差

    在消除系统误差的前提下,平行测定次数愈多,平均值愈接近真值。因此,增加测定次数,可以提高平均值精密度。在化学分析中,对于同一试样,通常要求平行测定2--4次。

    4 消除系统误差

    由于系统误差是由某种固定的原因造成的,因而找出这一原因,就可以消除系统误差的来源。有下列几种方法:

    (1) 对照试验-contrast test

    (2) 空白试验- blank test

    (3) 校准仪器 -calibration instrument

    (4) 分析结果的校正-correction result

    (1) 对照试验

    与标准试样的标准结果进行对照;标准试样、管理样、合成样、加入回收法。

    与其它成熟的分析方法进行对照;国家标准分析方法或公认的经典分析方法。

    由不同分析人员,不同实验室来进行对照试验。 内检、外检。

    (2) 空白试验

    空白实验:在不加待测组分的情况下,按照试样分析同样的操作手续和条件进行实验,所测定的结果为空白值,从试样测定结果中扣除空白值,来校正分析结果。

    消除由试剂、蒸馏水、实验器皿和环境带入的杂质引起的系统误差,但空白值不可太大。

    (3) 校准仪器

    仪器不准确引起的系统误差,通过校准仪器来减小其影响。例如砝码、移液管和滴定管等,在精确的分析中,必须进行校准,并在计算结果时采用校正值。

    (4) 分析结果的校正

    校正分析过程的方法误差,例用重量法测定试样中高含量的SiO2因硅酸盐沉淀不完全而使测定结果偏低,可用光度法测定滤液中少量的硅,而后将分析结果相加。

0
猜你喜欢最新推荐热门推荐更多推荐
举报帖子

执行举报

点赞用户
好友列表
加载中...
正在为您切换请稍后...