仪器信息网APP
选仪器、听讲座、看资讯

曲线拟合中的合理法原理

  • jack510070
    2012/03/19
  • 私聊

原子吸收光谱(AAS)

  • 本人最早看到合理法一说大约在去年本坛的一个帖子上,据说是瓦里安采用的一种新的回归模型。当时就对此产生兴趣,不过一直没有机会接触瓦里安的仪器,这件事也就搁下来了。最近几天看到坛子里又有议论这种方法的帖子,感谢cwk_12网友提供的贴图以及附件中的材料,终于了解了这种方法的原理。

    启发我的是材料中的拟合过程:先01点拟合一条直线,然后012三点拟合一条三次曲线,然后123以此类推。这一下子就激活了我以前研究S样条曲线插值算法中的一些回忆。不敢自密,这里把所谓合理拟合的算法原理写出来,供同好们议论。

    如果给定一组自/因变量实验点,要求你算出一条曲线通过所有这些采样点,你会怎样做呢?常用的多项式最小二乘线性回归法是无能为力的,它们只能做出一条曲线,使这些点离这条曲线的距离之平方和最小,而不是通过这些数据点。要得到通过这些实验点的曲线,只能采用分段样条曲线的形式,而最常用的就是3次样条曲线。

    最原始的样条曲线插值法在网上很容易找到,它的原理是这样的:对于一组n点实验样本,它们在自变量轴上可以分成n-1个小区间,对于这n-1个区间,每一个都定义一个三次多项式回归函数,形如yi=ai(x-xi)^3+bi(x-xi)^2+ci(x-xi)+di,这里xi是第i个实验样本的自变量。为了计算每个区间的aibicidi系数,要求这些回归方程有以下约束:1)它们都通过(xi,yi)(xi+1,yi+1)2)它们在xi上与前一区间的一阶导数和二阶导数连续。只有同时满足这两个条件,才能保证整体的光滑性。

    这两个约束使得每一个区间的4个参数能够求解出来,但是导致3对角线矩阵的求逆过程。如果实验样本数量很大,这个逆矩阵的求解是很困难的。于是就有了“合理法”这种简化模型。

    它的原理是这样的,对于n点实验样本(x1,y1)、(x2,y2xn,yn),为了使整体模型通过原点,在前面插入一个零点,即(0,0)。

    对于第i点,把它与前后两点共三点用回归方程yi=ai(x-xi)^3+bi(x-xi)^2+ci(x-xi)+di表达,要求方程通过(xi-1,yi-1)、(xi,yi)和(xi+1,yi+1)。我们知道,把这三点代入回归方程并不足以求出4个参数,为次强迫曲线过i点的一阶倒数为Si,这样就有Si=ci,于是4个方程联立就可以求出4个参数。需要强调一下,因为di=yici=Si,实际上只需要解二元一次方程组。

    Si如何确定呢?对于012这三点,S1(y1-0)/(x1-0)确定,对于i-1ii+1i>1),则用前一组算出的方程在其i+1点上的导数确定Si。第i个多项式方程只管xi-1xi之间的插值。

    由于这种算法不需要求解大矩阵的逆,尽管3对角矩阵的逆不难解,但是还是使计算复杂度控制在很简单的层次上,实际上人工计算就可以完成。在计量学和信号处理理论中,这种算法称为有理法或有理解(Rational)。

    以上是我对“合理法”的理解,权作引玉之砖耳。
  • 该帖子已被管理者-设置为精华,下面是奖励记录:
    +关注 私聊
  • ldgfive

    第1楼2012/03/19

    应助工程师

    这种方法的拟合好复杂,好象与二次拟合、三次拟合不太一样
    不过,曲线拟合方式,还是有一定意义的

0
    +关注 私聊
  • suiniubei

    第2楼2012/03/19

    还是不懂。
     最好能举个实例。

0
    +关注 私聊
  • 悠旸

    第3楼2012/03/19

    佩服楼主的深厚理论和钻研精神,遇到理论上的问题还要jack510070专家指点呀。

0
    +关注 私聊
  • wmj31

    第4楼2012/03/19

    拟合方式挺复杂的,估计用EXCEL没法拟合。文章很好,很精辟。

0
    +关注 私聊
  • 童话仙子

    第5楼2012/03/19

    很经典,这种拟合方法估计是独家的吧,毕竟多数仪器估计没有的拟合方式了

0
    +关注 私聊
  • cwk_12

    第6楼2012/03/20

    分析的很不错,其实到现在我对这个新合理拟合的理解还不是很透彻啊,看样子还得钻研啊

0
    +关注 私聊
  • jack510070

    第7楼2012/03/20

    有一个小漏洞:一阶导数约束应该施加于i-1点而非中间的第i点。
    谈谈我对这种方法的看法:
    先说它的使用: 如果实验样本点有5个,加上零点是6个。这种方法将给出5个分段的3次多项式,分别管0/1、1/2、2/3、3/4和4以后的浓度预报,这就要求实验点的吸光值是单调增的,即浓度越高,吸光值越大。遇到塞曼仪器的吸光度反转问题时,这种方法就不适用了。
    样品测定时,得到样品的吸光度,在这种方法中,首先确定吸光度落在那一个区间上,然后用牛顿法就可以算出其浓度值来了。对于三次方程,应该用诸如牛顿法这样的数值算法,而不是从数学手册上抄下3次方程的3个解公式,因为你还得费劲解释那一个解才是正确的。
    关键一点是: 这种方法强迫“工作曲线”通过所有实验样本点。我们知道,实验总会存在噪声和误差的,因此这种定量方式实际上放大了噪声和误差的影响,所以本人不建议采用这种定量方式。不过,“新合理法”貌似很有道理,似乎可以采用。
    我现在对新合理法有一种矛盾未能理解:它只用一个确定的公式,那么肯定无法通过所有实验点,这样的模型相关系数是不可能等于1的。

0
    +关注 私聊
  • qqqid

    第8楼2012/03/21

    楼主原文“要求你算出一条曲线通过所有这些采样点”,曲线通过所有采样点,本身就不合理,没有什么实用性,这种“要求”有点无聊了。

    讨论问题的前提不好,楼主的理论也只能自娱自乐一下。

0
    +关注 私聊
  • jack510070

    第9楼2012/03/21

    拜托你了解清楚这个问题的来龙去脉再作这样的评论好吗?

    qqqid(qqqid) 发表:楼主原文“要求你算出一条曲线通过所有这些采样点”,曲线通过所有采样点,本身就不合理,没有什么实用性,这种“要求”有点无聊了。

    讨论问题的前提不好,楼主的理论也只能自娱自乐一下。

0
  • 该帖子已被管理者-设置为精华,下面是奖励记录:加20积分,加5声望
    +关注 私聊
  • 桌子下面少个八

    第10楼2012/03/21

    文章很好,虽然没看得完全明白。
    这些完全是数学上的问题,有没有数学造诣比较高的人能够更深入浅出的解释一下。

0
查看更多
猜你喜欢最新推荐热门推荐更多推荐
举报帖子

执行举报

点赞用户
好友列表
加载中...
正在为您切换请稍后...