仪器信息网APP
选仪器、听讲座、看资讯

光谱选择方法:一种处理动态光谱和在线近红外建模的新优化方法

  • 导演叫我趴下脸着地
    2020/09/03
    Love to share
  • 私聊

近红外光谱(NIR)

  • 光谱选择方法:一种处理动态光谱和在线近红外建模的新优化方法



    摘要

    近红外光谱技术在流化床造粒中得到了广泛的应用。然而,在实践中仍有一些不足需要克服。在建模过程中有效的光谱选择一直是一个难题。在本研究中,引入了一种新的近红外传感器和余弦距离方法来解决这一问题,从而使流化过程“可视化”。在膨胀室的侧面固定一个近红外传感器来获取近红外光谱。然后基于余弦距离法选择有效谱以减小动态干扰的影响。最后,研究了光谱预处理和光谱选择方法,建立了偏最小二乘(PLS)模型来监测含水率。结果表明,含水率模型的预测均方根误差为0.124%,大大低于未进行有效光谱选择处理时的预测均方根误差。结果表明,在有效的光谱选择处理的帮助下,近红外传感器可以更准确地实时确定临界质量属性。它比工艺参数控制更容易理解制造过程。

    前言

    流化床造粒技术近年来在固体剂型的制造中得到了广泛的应用[1,2]。因为它可以使最终产品具有更好的流动性、均匀性和更少的制造过程中的交叉污染的机会[3,4]。而流化床造粒是一个封闭的过程,物料的流化状态是剧烈的、不可见的。要知道这些材料的物理化学性质是困难的。只有在生产过程的最后,分析人员才能对产品的质量进行测试,以决定产品是否合格。因此,流化床造粒的制造过程很难及时了解。

    过程分析技术(PAT)是由美国食品和药物管理局(FDA)在2004年提出的。其主要思想是利用各种过程分析工具对关键质量属性(CQAs)进行测量,以动态调整过程参数,保证最终产品的质量[5-7]。在目前的技术水平下,许多过程分析工具如成像方法[8]、微波共振(MR)方法[9]、空间滤波测速(SFV)方法[10]、光学相干层析成像(OCT)方法[11]、声发射(AE)方法[12]等都被用来尝试使过程可视化。近红外光谱(NIRS)是一种广泛使用的PAT工具,用于过程监测,如农业、食品、土壤、医学诊断和制药等许多领域[13-18]。研究人员为近红外光谱技术在流化床上的应用做了大量的工作。Markovic和他的同事利用漫反射光谱建立了偏最小二乘(PLS)模型来预测剩余溶剂含量、颗粒大小、筛分和涂层[19]的数量。Hudovornik等[20]还将近红外光谱法应用于涂层工艺中。对含水率和涂层厚度这两个CQAs进行了在线准确预测。Otsuka等在实验室规模的流化床造粒机[1]中,利用近红外光谱(NIRS)对醋氨酚配方颗粒在混合、造粒和干燥过程中的含水量和D50进行了预测。近红外光谱技术的成功应用对近红外光谱提出了更高的要求。

    随着近红外技术在实际生产中的应用越来越广泛,动态光谱选择成为一个重要的问题。在流化床造粒的实际应用中,由于样品(即颗粒)的动态特性,如工作距离、测量角度和颗粒物理性质(如密度)的变化,对稳定的光谱测量提出了特殊的挑战[21-23]。这种动态特性使线性谱有时不稳定,它包含一些与空气、振动和物质密度等有关的信息。为了改善近红外动态过程监测的性能,已经做了一些努力。Lee和同事[24]用平均法对线性近红外模型进行了优化。该方法是基于[25]平均聚类方案可以大大降低动态扰动影响的理论提出的。Manel的研究中记录了每个采样时间对应的光谱,并取其平均值作为相应的标准光谱,以减少异常光谱[26]的影响。玛格特和同事通过限制光谱在特定区域的吸光度来识别异常光谱。如果吸光度超出规定的范围[27],线谱被拒绝。上述方法在一定程度上减小了干扰信息的影响,但未具体消除异常谱。光谱选择仍然是非常必要的。

    因此,本研究引入了一种新型的微智能近红外光谱仪来实现流化床造粒的实时监测。在化学计量学的帮助下,研究了五种光谱选择方法,并将其应用于实时近红外光谱,结合预处理和可变选择方法提高近红外光谱模型的预测能力。该研究为动态谱的处理提供了一种新的方法,可以建立一个精度更高的PLS模型。

    2 材料和方法

    2.1 材料

    2.1.1 样品

    原料药对乙酰氨基酚购自山东昌达生物科技有限公司。玉米淀粉由山东聊城华阳制药辅料有限公司提供。以安徽山河制药辅料有限公司为原料制备了微晶纤维素和粘合剂羟丙基甲基纤维素。乳糖由镇江市富康生物工程有限公司提供。

    2.1.2 软件

    使用Matlab 2016b (Mathworkers Inc., USA)和Unscramber 10.1 (CAMO, Norway)软件对近红外光谱进行处理。采用Micro NIR Pro v2.3 (VIAVI, USA)进行在线光谱采集和监测。

    2.2 制粒过程

    这里使用的所有批次都是在实验室规模的流化床上生产的。(lgl002,山东SMA制药有限公司)本研究使用的标准配方如下。本研究使用的标准配方如下。对乙酰氨基酚(100克,5%w/w),玉米淀粉(500克,26%w/w),微晶纤维素(740克,38%w/w),乳糖(600克,31%w/w),羟丙基甲基纤维素(3% w/v)。

    在完全相同的条件下,对5批75个在线动态校准样品进行了重复,建立了近红外定量模型。另外,我们分别进行了两次造粒操作来验证我们的校准模型,然后进行了另外两组测试来评估校准模型的在线监测性能。设备最初预热15分钟至35℃。整个制粒过程约为60min。每个制粒过程的实验条件如下:进风温度为50-60℃。雾化压力为0.4巴。喷淋率为14ml /min,排风机开度为50%。将粉末在膨胀室中搅拌混合5min,然后将粘结剂溶液喷入粉末混合物中40min,再将颗粒干燥15min。

    2.3 光谱采集

    原始光谱由微型便携式近红外光谱仪(micro NIR PAT U spectrometer, VIAVI, USA)直接采用漫反射模块采集,如图1所示。为了避免温度对光谱仪的影响,将PAT-U光谱仪连接到一个耐热金属探针上。然后将探头固定在膨胀室的一侧,该一侧距离底屏15cm,垂直于采样口。详细信息如图1所示。

    每2秒自动在线获取近红外光谱,范围从908.1 nm到1676.0 nm,平均扫描100次。在制粒和干燥过程中,每4分钟用玻璃取样瓶抽取约6克样品,供参考分析。

    2.4 水分含量测定

    采用[28]干燥损失法(LOD)测定样品中水分含量。

    2.5 PLS模型

    建立了水分含量的PLS模型,利用主成分分析法识别光谱异常值。然后研究了不同的预处理方法来消除不相关的信息。为了进一步提高模型的预测能力,介绍了相关系数[31]法、竞争自适应重加权采样[32]法和逆区间偏最小二乘[33]法等波长选择方法并进行了比较。采用交叉验证均方根误差(RMSECV)、校准均方根误差(RMSEC)和校准决定系数(R2c)对模型进行评价。最后,利用两个外部独立批量样本验证了模型在预测均方根误差(RMSEP)方面的预测能力。并将所建立的模型应用于在线监测。

    3 结果和讨论

    3.1 NIR 光谱分析

    首先,制备了5批样品,用于造粒干燥过程中水分含量的标定模型研究。采集的原始光谱如图2a所示。在1200 nm和1500 nm附近可以发现两个主峰。在1200 nm左右的较弱峰可以归因于CH伸展的第二泛音[34,35]。在1500nm左右的强峰被指定为OH stretch[36]的第一泛音。虽然OH拉伸带为水分含量的测定提供了有价值的化学信息,但需要引入化学计量方法从重叠的光谱波段中挖掘出隐藏的信息。

    3.2 模型的建立与评价

    3.2.1 异常点的剔除

    主成分分析(PCA)是一种通过选择相关临界极限,推导置信椭圆来检测离群点的经典方法。在分数图中,样品的位置越近,它们的光谱越相似。一般来说,根据PCA得分图,如果样本的位置在置信椭圆(95%)之外,则被认定为异常样本。PCA能够成功地从定标集中去除部分不同的样本,去除异常值可以避免预测值的明显偏差,提高了模型的准确性和鲁棒性。在本研究中,经过光谱选择,利用PCA方法通过计算杠杆值来检测离群值(图5),图5给出了基于前两个主成分的主成分分析图。根据PCA得分图,样本4,5和69由于其位置在置信椭圆(95%)之外而被识别为异常点。

    3.2.2 光谱预处理

    为了尽量减少或消除光散射的畸变效应,以及基线漂移和随机噪声引起的不必要的系统变化,本研究采用了不同的预处理方法。采用Savitzky-Golay (SG)平滑、均值中心、SNV、MSC、一阶导数(FD)和二阶导数(SD)等预处理方法对建立含水量模型的原始光谱进行了转换。然后建立PLS模型对预处理方法进行评价。在此过程中,使用交叉验证(LOOCV)来选择潜在变量(LV)。模型参数见表1。如表1所示,SNV、FD、SG平滑(宽度7,多项式阶2)和均值中心的预处理组合应用于谱具有最好的预测能力。RMSEC、RMSECV、R2c、R2cv分别为0.1562%、0.1731%、0.965、0.957。

    3.2.3 波段选择

    采用CC和RiPLS方法进行波长选择,以提高模型的准确性和鲁棒性。在选择过程中,采用RMSECV对PLS模型进行评价。不同波长选择方法下PLS模型的结果如表2所示。结果表明,RiPLS在1063 ~ 1676 nm范围内(区间为25)最优,这与水体中O-H的首次泛音和O-H基团的变形有关。

    3.3.3模型的验证

    利用外部数据集(28个样本)对建立的PLS模型进行验证,结果如图6所示。结果表明,PLS模型的R2p、RMSEP分别为0.907和0.123%,表明该模型具有良好的预测能力。进一步对近红外预测数据和参考值进行配对t检验。配对t检验结果见表4。结果表明,两种方法测得的结果无显著差异,说明近红外光谱法在线监测含水率是可行的。

    4 结论

    采用一种新型的微近红外传感器来验证微水含量过程监测的可行性。为提高预测能力,提出并研究了不同的光谱选择方法。余弦距离法是一个非常普遍的光谱选择工具。此外,光谱预处理和变量选择方法对模型预测能力的提高也很重要。配对t检验发现,近红外法与参照法无显著差异。本研究可为利用便携式近红外微传感器在中试规模和工业流化床上进行造粒在线监测提供参考。目前的研究表明,近红外光谱法有潜力取代传统的测量方法来实时监测造粒过程。此外,可将CQA与关键工艺参数联系起来,实现固体制剂的智能化生产。

    Figure captions



    Fig. 1. A. The system of the fluid bed set-up used for granulating. B denotes the position of the NIR probe



    Fig. 2. (a) The raw spectra of the five granulation batches to establish the moisture content calibration model (b) The raw spectra to establish the moisture content calibration model and the raw spectra of two granulation batches to validate the calibration model



    Fig. 3. (a)-(e) Results of different spectral selection methods for the sampling point corresponding to 10 minute in the granulation process (f) RMSEP values of NIR models with different spectral selection methods



    Fig. 4. The trend of the reference data in the granulation process corresponds to the green part of the figure, and the trend of the reference data in the granulation process corresponds to the green part of the figure



    Fig. 5. Score plot of PCA for outlier detection. The ellipse is corresponding to 95% confidence

    Fig. 6. The validation for the models of moisture content



    Fig. 7. Monitoring results of in-line quantitative model of water content




    Table 1. Results of different spectral pretreatment methods for in-line NIR quantitative model

    Pre-method

    RMSEC (%)

    RMECV (%)

    R2c

    R2cv

    LVs

    SNV

    0.1601

    0.1822

    0.966

    0.960

    7

    MSC+Mean center

    0.1606

    0.1973

    0.963

    0.946

    7

    SNV+Mean center

    0.1665

    0.2013

    0.960

    0.945

    6

    FD +SG7+Mean center

    0.1504

    0.1815

    0.968

    0.956

    5

    SD +SG3+Mean center

    0.1671

    0.1878

    0.960

    0.943

    5

    MSC+FD+SG7+Mean center

    0.1557

    0.1736

    0.966

    0.959

    4

    SNV+ FD+SG7+Mean center

    0.1562

    0.1731

    0.965

    0.957

    4



    Table 2. The results of PLS models with different wavelength selection methods

    Wavelength Selection

    RMSEC (%)

    RMECV (%)

    R2c

    R2cv

    Wavelength (nm)

    LVs

    RiPLS10

    0.1578

    0.1780

    0.965

    0.957

    908-1274; 1342-1676

    4

    RiPLS15

    0.1419

    0.1675

    0.971

    0.960

    908-1366; 1466-1676

    6

    RiPLS20

    0.1510

    0.1680

    0.968

    0.960

    1032-1676

    4

    RiPLS25

    0.1510

    0.1671

    0.968

    0.959

    1063-1676

    4

    RiPLS30

    0.1514

    0.1727

    0.968

    0.958

    908-1274; 1466-1676

    6

    CC-0.15

    0.1556

    0.1703

    0.966

    0.958

    908-1453; 1521-1676

    4

    CC-0.20

    0.1557

    0.1724

    0.966

    0.960

    908-1416; 1614-1676

    4

    CC-0.25

    0.1715

    0.1877

    0.958

    0.955

    908-1404; 1658-1676

    4

    CC-0.30

    0.1502

    0.1727

    0.968

    0.958

    908-1391; 1670-1676

    5

    CC-0.35

    0.1504

    0.1716

    0.968

    0.960

    908-1385

    5



    Table 4. The results of paired t-test

    Methods


    Samples


    Mean (%)


    SD (%)


    t- test (0.05)

    H

    P

    LOD

    28

    2.43

    0.41

    0


    0.532


    NIRS

    28

    2.41

    0.45

举报帖子

执行举报

点赞用户
好友列表
加载中...
正在为您切换请稍后...