仪器信息网APP
选仪器、听讲座、看资讯

在线近红外光谱选择

  • 导演叫我趴下脸着地
    2020/09/10
    Love to share
  • 私聊

近红外光谱(NIR)

  • 光谱选择

    随着NIRS在实际生产中的应用越来越多,动态光谱的选择成为一个重要问题。在流化床混合的实际应用中,样品的动态特性对光谱测量的稳定性提出了特别的挑战[38-40]。这种动态特性使得谱线有时不稳定,谱线中含有一些与空气、振动和材料密度等有关的信息。为了提高动态过程近红外的监测性能,科研工作者们做了一些努力。Lee[41]采用平均法对线性近红外模型进行了优化,该方法是基于平均聚类算法[42]这一理论提出的,可以减小动态扰动的影响。在Manel[43]的研究中,记录了每个采样时间对应的光谱,并取其平均值作为对应的标准光谱,以减少异常光谱的影响。Margot[44]通过限制光谱在特定区域的吸光度来识别异常光谱。这些方法在一定程度上减小了干扰信息的影响,但并没有特异性地消除异常光谱,光谱选择仍然是非常必要的。

    异常光谱的出现,会使模型精度降低。由于混合过程中同一批次采集到的动态光谱差异非常明显,故对动态光谱进行选择是非常必要的。光谱选择中最困难的部分是如何有效、准确地滤除异常光谱,获得真实稳定的建模光谱。在本研究中,近红外光谱仪3 s自动采集一张光谱。在一个典型的混合过程中,收集了超过300近红外光谱,只有与取样时间相对应的光谱被记录下来并用于后续的光谱选择。整个取样过程约为2分钟,所以每个混合过程记录的校正集光谱矩阵约为40×125,其中40为获得的光谱数,125近红外光谱仪的波长通道数。记录每个样品取样起始对应的光谱序号,然后将对应取样时间自动采集的光谱用于光谱选择研究。光谱选择剔除了由于物料的理化因素和近红外测量因素导致的异常光谱,这使得建立的模型更精确、合理。本文研究了五种光谱选择方法,将其应用于原始光谱的选择,其原理及方法简述如下。

    同一批次采集的一簇动态光谱



    PCA

    主成分分析(PCA)是一种经典的离群点检测方法。一般情况下,如果样本位于置信区间(95%)之外,根据PCA得分图,该样本被确定为异常样本。在本研究中,对同一批次对应取样时间采集的一簇动态光谱进行PCA分析,如图所示。将PCA得分图中置信区间(95%)内的光谱选择出来用于后续的建模研究,95%置信线外的光谱被确定为异常光谱。

    诊断图法

    引入F残差和Hotelling′s T2统计量来识别异常光谱,对每个批次取样时采集的一簇近红外光谱进行诊断。Hotelling′s T2分布的置信线设定为95%F检验的α残差控制在0.05以内。F残差和Hotelling′s T2阈值以外的光谱都被确定为异常光谱。

    基线信息法

    在光谱采集过程中,近红外光谱仪工作距离、测量角度、粉末物理性质(如密度等)的变化会引起光谱不规则的基线漂移,这是光谱不稳定的主要因素之一。为了滤除异常光谱,本文采用了一种新的光谱离群点算法,即基线信息法对光谱进行选择,具体计算步骤如下:通过计算同一批次所有的建模光谱在每个变量点下吸光度值的标准偏差(SD),选择出吸光度SD值最小的变量点作为代表基线信息的变量点。然后,选择±1SD作为阈值,如果该变量点下光谱的吸光度值高于允许的最大吸光度值或偏离允许的最低吸光度值,则光谱将被作为异常光谱滤除,阈值范围内的光谱被选择出来用于后续建模研究。

    光谱标准偏差法(SDoS

    同一混合批次理想的建模光谱应该由一些高度相似的光谱组成,这意味着这些光谱的标准偏差应该趋近于零,SDoS确定光谱一致性的方法类似于计算移动块标准偏差(Moving Block Standard Deviation, MBSD)。每个批次取样时采集的一簇近红外光谱被看作是一个矩阵(X),计算矩阵X的标准偏差为STD。使用留一法每次拿出一张光谱,然后计算剩余光谱的标准偏差为S。如果S,则将剔除的一张光谱视为异常谱,以此类推,直至检测完所有的光谱。

    向量夹角余弦距离法

    在本研究中,引用向量夹角余弦距离来评估光谱的相似度,并根据相似度来剔除异常光谱。光谱相似度计算基于同一批次所有的建模光谱与其平均光谱的夹角余弦距离所得。具体计算过程如下:每张光谱被视为一个多维向量,计算矩阵X中每张光谱与平均光谱的夹角余弦距离M,同一批次每张光谱与平均光谱夹角余弦距离的标准偏差SD被设置为阈值。当M大于1倍的SD时,光谱被拒绝,剩余的光谱被选择出来用于后续的建模研究。

附件:

猜你喜欢最新推荐热门推荐更多推荐
举报帖子

执行举报

点赞用户
好友列表
加载中...
正在为您切换请稍后...