仪器信息网APP
选仪器、听讲座、看资讯

基于近红外光谱分析技术的2,3,5-三甲基苯醌粗品萃取过程定量模型优化研究

  • qindong413
    2017/08/31
  • 私聊

化学药检测

  • 基于近红外光谱分析技术的2,3,5-三甲基苯醌粗品萃取过程定量模型优化研究

    中文摘要:目的实际工业生产工艺中,萃取是一项耗时耗力的过程,萃取终点的确定通常采用离线的HPLC, gc或由熟练工人根据经验判断,这些方法操作较复杂或是不够准确,在实际生产中缺乏一种快速有效的检测手段以判断萃取终点,节省操作时间,避免过分萃取浪费溶剂。利用近红外光谱技术可以明显改善萃取工艺。方法本实验针对2,3,5-三甲基苯醌(TMBQ)粗品萃取环节,采用偏最小二乘法(PLS)建立模型,考察了不同预处理方法与变量选择方法对模型的影响以优化模型,采用近红外光谱结合PLS算法建立TMBQ萃取过程含量快速检测模型,并使用不同预处理方法与波段选择方法对模型进行优化,最终确定使用一阶导数+SG15点平滑预处理结合iPLS选择波段建立PLS模型。结果建立模型的各项参数为:波普区间4385.33cm-1-5152.86cm-1, 5928.11cm-1-6309.94cm-1,模型决定系数R2=0.996, RMSEP=0.1350。结论建立的模型精密度与准确度良好,可以满足含量分析的需要,是TMBQ萃取过程含量快速检测的有效方法,可以快速准确的对三甲基苯醌粗品萃取过程进行在线监测,提供了一种用于该工艺环节的快速检测手段,如果应用于生产,可以节省操作时间,避免溶剂浪费。
    关键词:近红外光谱分析;2,3,5-三甲基苯醌;萃取
    2,3,5-三甲基苯醌是维生素E的主要中间体。2,3,5-三甲基苯醌在国外已有生产, 但国内尚未见文献报道。国内用2,3,5-三甲基苯醌主要依赖进口。因此,开展2,3,5-三甲基苯醌的合成研究对发展国内维生素 E 的生产具有重要意义。TMHQ的合成工艺国内外己有多种报道,较为先进的是TMP法与异佛尔酮法,TNBQ粗品萃取过程是合成TMBQ的关键环节。在制药领域,NIRS作为一种重要的PAT工具,已成功用于药物的原辅料评价、关键过程的监测和控制、成品的快速放行和质量监测等各个环节,为保证产品质量、降低生产成本、革新生产过程发挥了重要的作用。
    1实验材料与仪器
    1.1仪器

    Antaris Ⅱ傅里叶变换近红外光谱仪(美国Thermo Fisher公司),7890A气相色谱仪-氢焰离子化检测器(美国Agilent公司),HP-1毛细管色谱柱(美国Agilent公司)BT224S电子分析天平(德国Sartorius公司),容量瓶,100ml圆底烧瓶,分液漏斗,移液枪(美国ThermoFisher公司)。RESULT近红外光谱采集软件,TQAnalyst近红外光谱分析软件,Matlab数据处理软件。
    1.2试剂
    2,3,6-三甲基苯醌(合成步骤见第二章),石油醚(天津富宇精细化工有限公司,沸程60℃-90℃)。
    2方法
    2.1样品制备和处理

    按照第二章步骤合成得TMBQ得其石油醚溶液,萃取水相合并有机相,旋蒸浓缩除去石油醚至橙黄色油状液体,称重,再用石油醚作为溶剂配置1ug/ml~50mg/ml一系列溶液。
    2.2光谱采集
    波长范围4000 cm-1-10000cm-1;扫描次数32;分辨率8 cm-1,使用4mm光程的玻璃样品管乘装液体样品,采集样品前采集背景以消除背景干扰,每个样品重复采集三次光谱。光谱采集在恒定室温(24℃)与恒定湿度的条件下进行。
    2.3样品集划分
    使用K-S分类法将所有66个样品换分为48个校正集与18个验证集。
    2.4模型建立与优化
    采用导数、平滑等方法对原始光谱进行预处理,应用偏最小二乘法(PLS)建立模型,结合RMSEP等评价参数,通过变量选择方法选择特征波段优化模型。
    2.5 重复性考察
    选择3个验证集样品,每个样品连续采集10次光谱,使用建立好的模型预测每张光谱,并计算出每个样品十次预测值的均值和标准偏差。是第i个样品的第j张光谱,第i个样品共测定ri个光谱,第i个样品的预测平均值为:



    复测定的标准偏差为:




    用c2检验来考察这些重复性标准偏差是否属于同一总体:


    z为需要重复测定的样品数,将所得χ2与自由度(z-1)临界值比较,若χ2在临界值以下,则重复测定的所有方差属于同一总体,标准偏差均值σ可以作为近红外测定的标准偏差,近红外分析方法的重复性为z××σmax。如果χ2大于临界值,近红外分析方法的重复性随样品组分浓度不同而不同,这时,近红外分析方法的重复性不大于z××σmax(σmax为σi中的最大值)。
    2.6气相色谱检测
    初始温度180℃恒温5min,以10℃/min的速率升温至240℃。进样口温度:300,检测器温度:300,载气:氮气,载气流速:3ml/min,进样量:0.5ul。
    3结果
    3.1校正集与验证计划分

    使用K-S分类法将所有66个样品换分为48个校正集与18个验证集。校正集与验证集的第一第二主成分分布图如图1,其中黑色符号代表校正集样品,红色符号代表验证集样品,验证集均匀分布于校正集中,可见使用该方法分类合理。

    图1 所有样品主成分分布图

    3.2预处理方法的选择
    考察无预处理、一阶导数+SG5点平滑、一阶导数加SG9点平滑、一阶导数+SG15点平滑、二阶导数加15点平滑这几种方式的建模结果,以RMSEC、RMSECV、RMSEP以及R2作为评价指标,结果见表1。

    表1 预处理方法评价参数

    无预处理的模型结果最差,说明噪声对模型结果有较大影响,原始光谱如图2。SG15点平滑+一阶导数的预处理结果RMSEC、RMSECV以及RMSEP最小,R2最高。因此选择SG15点平滑+一阶导数作为模型的预处理方法,预处理后光谱如图3。

    图2 原始光谱图


    图3 一阶导数+SG15点平滑预处理光谱图

    3.2异常样本的剔除
    图4为校正集样品在学生残差-杠杆值图中的分布。图中5号(红色方框标记)样品学生残差值与杠杆值都非常高,判定为异常样品,猜测为溶液配制错误或者在光谱采集过程中出现错误,因此在后期模型优化中剔除这一异常值。

    图4 学生残差-杠杆值关系图

    3.3波段选择结果
    以一阶导数+SG15点平滑为最优预处理方法进行波段选择,主要考察ForwardiPLS、SPA、相关系数法三种方法。
    3.3.1iPLS波段选择结果
    设定20为最大主成分数,分别考察以50、100、200个变量为波段基础的建模效果。红色虚线是全波段建模的RMSECV,红色与绿色条带的高度代表以此条带的变量建模所得RMSECV,从图5中可见,绿色条带的RMSECV值最小,因此绿色条带是被选择用于建模的波段,红色条带则表示不被选择的区域。表2为各变量基础的模型参数。

    图5 以50个变量为基础的iPLS法波段选择效果图


    图6 以100个变量为基础的iPLS法波段选择效果图


    图7 以200个变量为基础的iPLS法波段选择效果图

    表2 不同变量基础的建模结果

    3.3.2 SPA法波段选择结果
    SPA算法首先通过完成n个波长分组各M个波长选择,然后通过多元定量校正模型完成m(1£m£M)个最优波长的选定。图8为SPA法选择变量的效果图。
    运行SPA算法共选择3个变量,对应波数为4188.65cm-1,4885.50cm-1,7503.50cm-1,为图中红色方框标注,以此3个变量建立PLS模型,结果如表 所示,RMSECV与RMSEP均有所增加,R2降低,表明模型预测能力与线性都有所降低。分析原因可能是此方法在选择波段过程中由1557个变量减少到3个,光谱变量删除过多,去除大量无关变量的同时导致许多有价值信息的丢失。

    图8 SPA算法变量选择结果图

    3.3.3相关系数法波段选择结果
    将相关系数阈值设定为0.6、0.7、0.8,使用相关系数法计算出TMBQ含量值与波数的相关系数图,如图9,图中虚线为设定的相关系数阈值,虚线以上及以及的部分代表相关系数大于阈值的波段,阈值越高,被选择的波段越少,当阈值设为0.8时,大于阈值的波段已经较少。以超过阈值的波段建立PLS模型。模型结果如表3,可见将阈值设为0.6时模型结果最好。

    a

    b

    c

    图9 不同阈值的波数相关图(a阈值设为0.6,b阈值设为0.7,c阈值设为0.8)

    表3 相关系数法建模参数


    3.4 小结
    综合比较全波段建模与三种波段选择方法建模结果,参数如表。其中使用iPLS法选取600个变量,波段区间为4385.33cm-1-5152.86cm-1,5928.11cm-1-6309.94 cm-1,分别对应双键上C-H第一组合频与一级倍频吸收,建模后具有最高的决定系数和最低的各项方差值,这些参数表明使用该方法建立的模型预测能力最好,与真实值最接近。因此本实验主要选择iPLS方法选择变量,结合一阶导数+SG15点平滑建立模型,应用于TMBQ萃取过程含量的快速检测。

    表4 各变量选择方法比较


    图10 优化后模型预测线性图

    3.5重复性试验考察
    采集验证集8号、25号、36号样品,对TMBQ含量模型进行重复性测试,每样品采集10次光谱。预测结果见表5。

    表5 重复性考察结果

    自由度为2时,χ2临界值为5.99。实际χ2小于临界值,近红外光谱分析方法重复性为0.154,可以满足分析应用。
    3.6NIR预测考察
    第一次使用20ml石油醚萃取,之后每次使用等体积10ml石油醚萃取,共萃取8次,使用gc测定TMBQ峰面积,并使用NIR采集8次萃取液近红外光谱,使用优化好的定量模型对其含量进行预测。

    图11 NIR预测值

    图11为NIR对萃取过程的预测结果,第一次萃取即将大部分产品萃取出,随后的每次萃取量呈逐渐下降的趋势,在第五次萃取后,萃取液中产品含量几乎为0,并且随后没有变化,表明已达到萃取终点。使用gc检测第4~8次萃取液,记录TMBQ峰面积,结果如表6。

    表6 gc检测结果表

    第五次萃取后,TMBQ峰面积已经很小,并且基本没有变化,因此在4次萃取完全可以将水相中的TMBQ萃取完全,继续萃取已经没有意义,gc检测与NIR预测结果相符,表明此模型预测能力良好,对萃取工艺具有一定指导意义。
    4讨论
    本实验采用近红外光谱结合PLS算法建立TMBQ萃取过程含量快速检测模型,并使用不同预处理方法与波段选择方法对模型进行优化,最终确定使用一阶导数+SG15点平滑预处理结合iPLS选择波段建立PLS模型,建模所用波段区间为4385.33 cm-1-5152.86cm-1,5928.11 cm-1-6309.94cm-1,模型决定系数R2=0.996,RMSEP=0.1350。使用gc验证了NIR模型对萃取过程与终点的预测能力。以上结果表明模型精密度与准确度良好,可以满足含量分析的需要,是TMBQ萃取过程含量快速检测的有效方法。
    5参考文献
    孙月婷. 维生素E 的合成与分析研究现状. 广州化工, 2011, 39(6): 34-35.
    O.A.Kholdeava· Synthesis of Vitamia E· J.Mol.Cotal,1992,88(5):235~ 244
    孔黎明, 周涛, 菅盘铭. 2, 3, 5- 三甲基苯醌和2, 3, 5- 三甲基氢醌的一种合成方法: 中国, 102219665. 2011-10-19.
    A BShishmakov, Yu V Mikushina, O V Koryakova. Oxidation of 2,3,6-Trimethylphenolon Titanium Dioxide Xerogel by Hydrogen Peroxide in the Absence of an OrganicSolvent. RUSSIAN JOURNAL OF APPLIED CHEMISTRY, 2011, 84(9):1555-1559.
    O V Zalomaeva, N N Trukhan,I D Ivanchikova, et al. EPR study on the mechanism of H2O2-basedoxidation of alkylphenols over titanium single-site catalysts. J. Mol.Catal. A: Chem., 2007, 277(1-2), 185~192.
    褚小立. 化学计量学方法与分子光谱分析技术.北京; 化学工业出版社. 2011.
    董学锋,戴连奎,黄承伟等.结合PLS-DA与SVM的近红外光谱软测量方法
  • 该帖子已被版主-云雀加10积分,加2经验;加分理由:原创奖励
0
猜你喜欢最新推荐热门推荐更多推荐
举报帖子

执行举报

点赞用户
好友列表
加载中...
正在为您切换请稍后...