仪器信息网APP
选仪器、听讲座、看资讯

基于近红外光谱分析技术的人纤维蛋白原工艺过程原液中纤原的含量的快速检测

  • qindong413
    2016/09/29
  • 私聊

近红外光谱(NIR)

  • 中文摘要: 目的 利用近红外光谱分析技术,建立原液中总蛋白及纤原含量的检测模型,实现原液的快速检定。 方法 选取超滤完成后配制前原液为研究对象,首先制备了纤原含量有一定梯度的样品,共54个,用透射模块采集其近红外光谱。实验收集生产中大量不同纤原纯度的原液样品,建立能够直接预测原液纤原纯度的近红外定量模型。 结果 模型的各项参数为:R2=0.999,RMSEC=0.3575,RMSECV=0.4894,RMSEP=0.5208。 结论 模型的准确度和精密度较好,可实现原液的快速检定以及在线监测。

    关键词:近红外光谱分析;人纤维蛋白原;纤原含量


    人纤维蛋白原(HumanFibrinogen,Fg)是血浆的主要成分,含量高达2~4g/L。在人凝血反应的最后阶段在凝血酶与人凝血因子ⅩⅢ、Ca2+作用下形成纤维蛋白凝胶,将血液有形成分包绕其中,达到止血的目的。对于人纤维蛋白原工艺过程原液中纤原的含量的测定是通过检定后才能进入半成品和成品的制备,采用凯氏定氮法检测纤原的含量,进而计算得出。凯氏定氮法十分麻烦,检测时间较长,而且用到硫酸等危险试剂,不利于公司生产中的快速放行。在制药领域,NIRS作为一种重要的PAT工具,已成功用于药物的原辅料质量评价、关键过程的监测和控制、成品的快速放行和质量检测等各个环节,为保证产品质量、降低生产成本、革新生产过程发挥了重要的作用。利用近红外光谱分析技术,建立原液中总蛋白及纤原含量的检测模型,可以实现原液的快速检定以及在线监测,提高生产效率。
    1材料
    1.1试剂

    纤维蛋白原原液(山东泰邦生物制品有限公司,批号201409S02,纤原含量56.94mg/mL);注射用水。
    1.2仪器
    Antaris Ⅱ傅里叶变换近红外光谱仪(美国Thermo Fisher scientific公司),附件配置:透射检测器,1mm光程玻璃比色皿;Result光谱采集软件;Matlab 2009化学计量学软件(美国Mathworks公司)。
    2方法
    2.1样品制备

    在纤原的生产过程中,超滤后的原液留样200mL。按照不同的比例用注射用水将原液稀释,得到含有不同纤原含量的样品共54个。
    2.2近红外光谱采集
    每个样品取适量装于光程1mm的比色皿中,采集其透射光谱,扫描范围为10000-4000 cm-1,分辨率为8 cm-1,扫描次数32次,每小时扫描一次背景。
    2.3校正集和验证集的划分
    采用K-S分类的方法将样品划分为校正集和验证集,二者的比例为2:1,得到36个校正集样品和18个验证集样品。
    2.4预处理方法的选择
    通过对原始光谱数据进行平滑、微分等预处理,可消除仪器背景或基线漂移等对光谱的影响,提高光谱的质量,凸显有效信息。本实验采用了Autoscale、一阶导数、二阶导数,以及一阶导数和Autoscale同时使用的预处理方法对光谱数据进行处理,依据建模结果的情况优选最佳方法。
    2.5光谱区间的选择
    通过光谱变量的筛选,可去除大量的无关变量,大大减少建模的计算量,节省时间。本研究中分别采用iPLS、相关系数法、基因算法(GA)筛选光谱变量,使用选择的谱区建立PLS模型,并依据模型结果的优劣确定最终使用的变量选择方法和最优的光谱区间。
    2.6重复性考察

    从验证集中选择3个样品,每个样品分别测定10次光谱,用建立的模型预测其纤原含量,计算每个样品预测值的平均值和标准偏差。用χ2检验考察这些重复性标准偏差是否属于同一总体:



    当χ2值小于临界值,重复测定的所有方差属于同一总体,近红外分析方法测定纤原含量的重复性可按z××σ算出。
    3结果
    3.1样品中纤原含量的分布

    共制备54个样品,其纤原含量范围在3.80mg·mL-1~56.94 mg·mL-1,分布较为均匀。
    3.2样品的近红外光谱
    54个样品的原始近红外光谱图如图1所示。


    图1纤原样品近红外光谱



    从图中可以看出,光谱有一定的基线漂移,而且水的吸收较强,目标物质的吸收信号不明显,不能单纯通过光谱得到关于纤维蛋白原含量的信息,因此需要借助化学计量学的方法对光谱进行处理,建立纤原含量测定的定量分析模型。
    3.3样品校正集和验证集划分结果
    采用K-S分类方法将样品进行划分,选择36个样品作为校正集,18个样品作为验证集。如图2所示,样品均匀的分布在主成分空间中,其中灰色的点代表校正集样品,红色的点代表验证集的样品,验证集样品较为均匀的分布在校正集样品之中,满足划分的要求。


    图2样品集PC1&PC2得分图



    3.4异常样品的检查
    从样品的PCA得分图中可以发现,有一个样品点位于95%的置信限外,可能存在异常样品,需利用学生化残差-杠杆值分布图来进行进一步筛查。图3为校正集样品的学生化残差-杠杆图,图中未发现学生化残差值和杠杆值过大的样品,说明校正集中无异常点。


    图3校正集样品的学生化残差-杠杆图



    3.5预处理方法的选择结果
    分别采用Autoscale、一阶导数、二阶导数,以及一阶导数和Autoscale同时使用的预处理方法对光谱数据进行处理,然后用处理后的光谱进行建模。表1列举了用不同预处理方法处理后的光谱进行建模所得到的模型参数,通过对比可以很直观地发现,光谱经一阶导数+Autoscale处理后,建立的模型具有更好的线性,RMSEC、RMSECV和RMSEP值都有明显的降低,所以选用此方法作为最终的预处理方法。图4为用此法预处理后在全光谱范围内建立的PLS模型。

    表1不同预处理方法对建模的影响

    预处理方法

    R2

    RMSEC

    RMSECV

    RMSEP

    PCs

    原始光谱

    0.986

    1.4301

    1.6954

    1.3725

    2

    Autoscale

    0.996

    0.7399

    0.9276

    0.6983

    4

    一阶导数

    0.993

    0.9913

    1.2920

    0.8967

    4

    二阶导数

    0.991

    1.0997

    1.7300

    1.2479

    4

    一阶导数+Autoscale

    0.997

    0.6325

    0.8056

    0.7479

    4




    图4一阶导数Autoscale预处理全光谱建模结果图



    3.6光谱区间选择结果
    分别采用iPLS、相关系数法和GA考察不同光谱区间对模型性能的影响,从而筛选出最佳的光谱变量。
    3.6.1iPLS选择结果
    iPLS变量选择方法是一种基于PLS法发展得到的一种有效的光谱区间选择方法,其基本原理是:将全光谱范围平均分为若干个光谱区间,然后对每个光谱区间进行PLS模型的建立,根据每个子区间得到的RMSECV值选择一个或多个子区间用于最终PLS定量分析模型的建立。
    本实验采用ReverseiPLS方法选择光谱区间。每个间隔宽度为100个变量,一共15个间隔,然后用每个间隔进行PLS模型的建立,根据每个子区间得到的RMSECV值选择一个或多个间隔用于最终PLS定量分析模型的建立。最终选择的结果如图5所示,红色虚线代表全光谱建模的RMSECV值,绿色部分代表最终选择用来建模的区间,红色部分为没有参与建模的区间。图6显示了用选择的光谱区间进行建模的结果,模型的决定系数为0.998,RMSEC=0.5879,RMSECV=0.8483,RMSEP=0.5235,各项参数较全光谱建模都有了提升。


    图5Reverse iPLS选择波段图





    图6iPLS选择光谱区间建模结果图



    3.6.2GA变量选择结果

    GA是一种通过变量选择使模型的预测能力更准确的方法,它以自然选择和遗传理论为基础,对于一个给定的光谱矩阵,随机产生一定数目的子集,计算每一个子集的RMSECV值,将比RMSECV均值高的一半数目的子集去掉,将剩下的子集进行繁殖并允许一定的变异,重复计算一直到得到的RMSECV值最低为止。

    图7所示GA选择光谱区间结果图,图中颜色由红变蓝表示模型的RMSECV值逐渐变小。彩色部分为通过计算筛选出来的光谱区间,空白部分则予以剔除,建模结果如图8所示,决定系数为0.999,RMSEC=0.3575,RMSECV=0.4894,RMSEP=0.5208,模型的性能较全光谱建模也得到了很大提升。

    图7GA变量选择结果图

    图8GA选择光谱区间建模结果图



    3.6.3相关系数法变量选择结果

    预处理后的光谱采用相关系数法进行变量的选择,计算光谱的各个变量与纤原含量之间的相关系数,得到的结果如图9所示。相关系数越大说明该波数点代表的纤原含量信息越多,选择相关系数绝对值大于0.8的部分建立模型,图10为经相关系数法得到的用于最终模型建立的光谱变量选择结果,图中蓝色的线表示原始近红外平均光谱图,红色的点代表被选作用于建模的变量点,经波段选择后参与建模的波数点大大降低,由1557个减少为734个。

    图9相关系数图

    图10相关系数法变量选择结果

    图11为相关系数法所选变量得到的建模结果图,经过变量选择模型的预测能力有所提高,各项参数较全光谱建模也都有所提升。

    图11相关系数法建模结果图



    3.6.4小结

    通过使用iPLS、GA和相关系数法三种不同的变量选择方法,对用于建模的光谱区间进行选择,用优选出来的区间建立PLS模型,各个模型的评价参数如表2所示。通过比较,可以发现,用GA选择的变量建立PLS模型,模型的性能最佳,所以最终建模使用的方法为一阶导数+Autoscale进行光谱预处理,GA进行光谱区间的选择。

    表2不同变量筛选方法比较

    波段选择方法

    R2

    RMSEC

    RMSECV

    RMSEP

    PCs

    0.997

    0.6325

    0.8056

    0.7479

    4

    iPLS

    0.998

    0.5879

    0.8483

    0.5235

    3

    GA

    0.999

    0.3575

    0.4894

    0.5208

    5

    相关系数法

    0.997

    0.5780

    0.7094

    0.7416

    3



    3.7重复性试验结果

    选取验证集样品中的3号、21号和44号,每个样品分别测定10次光谱,用所建模型对其纤原含量进行预测,预测和统计结果如表3所示。

    表3重复性结果

    预测值

    测量次数

    3号(mg·mL-1

    21号(mg·mL-1

    44号(mg·mL-1

    1

    45.55

    28.47

    14.24

    2

    45.67

    28.36

    14.23

    3

    45.71

    28.39

    14.19

    4

    45.58

    28.44

    14.31

    5

    45.47

    28.52

    14.36

    6

    45.62

    28.56

    14.28

    7

    45.52

    28.43

    14.32

    8

    45.49

    28.36

    14.21

    9

    45.54

    28.49

    14.26

    10

    45.66

    28.53

    14.37

    平均值

    45.58

    28.46

    14.28

    标准偏差

    0.08

    0.07

    0.06

    χ2

    0.70

    重复性

    ×σ=0.30

    对于给定95%置信水平,χ20.05,2临界值=5.99,所得的χ2值小于5.99,说明重复测定的所有方差属于同一总体,近红外方法测定样品纤原含量的重复性可按z××σ计算得出,为0.30。



    4讨论

    本实验采用近红外光谱分析技术,建立了纤维蛋白原原液中纤原含量的PLS定量模型,可准确、快速地预测原液中的纤原含量,证明了在生产中用近红外方法快速检测原液中纤原纯度是可行的。在研究过程中,首先制备了纤原含量有一定梯度的样品,共54个,用透射模块采集其近红外光谱。建模过程中,最终确立了一阶导数+Autoscale的光谱预处理方法,以及GA的谱区选择方法,建立的模型的各项参数为:R2=0.999,RMSEC=0.3575,RMSECV=0.4894,RMSEP=0.5208,模型的准确度和精密度都非常理想。

    实验下一步将在生产过程中收集大量不同纤原纯度的原液样品,以建立能够直接预测原液纤原纯度的近红外定量模型,以实现真正的生产过程实时监控。


    参考文献
    倪道明. 血液制品 (第三版) . 北京: 人民卫生出版社, 2013.
    马会利, 冯军, 陈纪林等. 人纤维蛋白原结构和功能研究进展. 四川生理科学杂志, 2002, 24(2): 53-7.
    VELIK-SALCHNER C, HAAS T, INNERHOFER P, et al.The effect of fibrinogen concentrate on thrombocytopenia . Journal ofthrombosis and haemostasis : JTH, 2007, 5(5): 1019-25.
    何英武,吴瑞玲.血浆纤维蛋白原测定的方法进展及临床意义. 现代中西医结合杂志,2004, 13(18): 2511-2.
    Li L, DingB, Yang Q, et al. The relevance study of effective information between nearinfrared spectroscopy and chondroitin sulfate in ethanol precipitation process. J Innov Opt Heal Sci, 2014,07(06): 1450022.
    Wang P, ZhangH, Yang H, et al. Rapid determination of major bioactive isoflavonoid compoundsduring the extraction process of kudzu (Pueraria lobata) by near-infraredtransmission spectroscopy .Spectrochim Acta A Mol Biomol Spectrosc, 2015, 137: 1403-1408.
    Zhang XB,Feng YC, Hu CQ. Feasibility and extension of universal quantitative models formoisture content determination in beta-lactam powder injections bynear-infrared spectroscopy . AnalChim Acta, 2008, 630(2): 131-140.
猜你喜欢最新推荐热门推荐更多推荐
举报帖子

执行举报

点赞用户
好友列表
加载中...
正在为您切换请稍后...