仪器信息网APP
选仪器、听讲座、看资讯

基于PLS算法的实验数据建模方法

数据处理

  • 基于PLS算法的实验数据建模方法

    谢佩章(南京质检NQI)

    摘要:检验检测过程中产生的大量数据,由于其本质是非线性的,传统的拟合方法具有一定的局限性。本文所提出的PLS算法基于数据驱动模型的方法,其本质是数学拟合方法,不依赖于过程机理,同时能够处理各类非线性数据,因此适用于各类检验检测数据的建模。



    关键词:PLS, 数据驱动模型,非线性
    1 背景
    检验检测过程中产生的数据通常存在着内部机理复杂、变量众多、过程存在干扰、非线性等问题,难以建立精确的机理模型,这就使得很多基于机理的建模方法失效或者基本失效。
    模型建立的方法目前主要有三类:基于机理建模的方法、基于知识模型的方法以及基于数据驱动的方法。其中基于机理模型的方法通过过程所遵循的物理、化学规律建立关键参数与其他可测变量之间的数学方程,其模型准确性较高,但是建立模型的基本条件是对生产过程的机理有比较深入的认识。基于知识模型的方法对生产过程的实际操作经验和定性分析等结果的归纳总结,而获得诸如专家系统形成的知识模型,这种模型具有形式简单,易于理解和在线实现方便的特点,但精度较低,知识规则提取困难等缺点。基于数据驱动模型的方法通过采集过程中产生的丰富数据,根据多元统计分析、人工智能等理论,建立关键参数变量与其他可测变量的统计回归模型,具有不依赖于过程机理、较高的精确性等优点,然而由于其数据具有非线性、高维等特点,使得其建模方法较为复杂且不易理解等缺点。比较三种建模方法,在检验检测过程中,由于多数实验机理较为复杂,且非线性、干扰较大,不易于使用机理建模及知识建模,特别适合于数据驱动模型方法。
    数据驱动建模方法,主要有两类,一类是基于数理统计的方法,另一类是非统计建模的方法,目前非统计建模的方法主要有神经网络等现代模型方法,统计类建模历史较为悠久,对于线性方法具有较强的适应性。对于多变量数据,由于其各参数间存在着关联及共线性等问题,为了更好的解决这些问题,多元统计方法在不断的发展,如PCA-主元分析、PLS-偏最小二乘算法、SVM-支持向量机、小波分析、独立主元分析等。这些方法在建模方面得到了很好的应用。
    2 偏最小二乘方法(PLS)
    偏最小二乘方法采用成分提取的方法,在抽取自变量特征信息的同时,也抽取拟合参数的特征信息,并以最大化自变量与拟合参数特征信息的相关性为目标。



    3. 总结
    偏最小二乘算法对于非线性、难以使用机理建模或者知识建模、参数间具有耦合性的数据,具有良好的拟合能力,在数据分析方面有一定的作用。
猜你喜欢最新推荐热门推荐更多推荐
举报帖子

执行举报

点赞用户
好友列表
加载中...
正在为您切换请稍后...