中文摘要: 目的 利用近红外光谱分析技术可以有效的对纤原冻干产品的水分含量进行实时测定,优化冻干过程。 方法 选取冻干完成后制品为研究对象,制备了水分含量有一定梯度的样品共60个,用积分球漫反射模块采集其近红外光谱,然后用卡尔费休容量滴定法测定每个样品的水分含量作为一级数建立近红外模型,以R2、RMSEC、RMSECV、RMSEP对模型进行评价。结果 模型各项参数为:R2=0.881,RMSEC=0.4426,RMSECV=0.8370,RMSEP=0.6311。 结论 所建立模型可作为在线监控纤原冻干过程水分含量的基础,将冻干设备进行相关的改造后,借助光纤可实现产品水分含量的实时监测。
关键词:近红外光谱分析;人纤维蛋白原;水分
人纤维蛋白原(HumanFibrinogen,Fg)是血浆的主要成分,含量高达2~4 g/L。在人凝血反应的最后阶段在凝血酶与人凝血因子ⅩⅢ、Ca2+作用下形成纤维蛋白凝胶,将血液有形成分包绕其中,达到止血的目的。纤维蛋白原的原液经配制、分装后,进行冷冻干燥,使产品的水分含量控制在5%以下。人纤维蛋白原工艺过程纤原产品水分的检测是使用卡尔费休水分测定方法,该传统方法费时费力,对产品具有破坏性,极易引入误差而使测定不准确。在制药领域,NIRS作为一种重要的PAT工具,已成功用于药物的原辅料质量评价、关键过程的监测和控制、成品的快速放行和质量检测等各个环节,为保证产品质量、降低生产成本、革新生产过程发挥了重要的作用。利用近红外光谱分析技术可以有效的对纤原冻干产品的水分含量进行实时测定,从而极大地优化冻干过程。
1材料
1.1试剂
人纤维蛋白原(冻干剂,山东泰邦生物制品有限公司,批号201409S02);甲醇(分析纯,国药集团化学试剂有限公司);卡尔·费休试剂(KFR-06型,天津市科密欧化学试剂有限公司)。
1.2仪器
Antaris Ⅱ傅里叶变换近红外光谱仪(美国ThermoFisher scientific公司),附件配置:积分球漫反射检测器;KF-4型自动水分测定仪(南京科环分析仪器有限公司);EL204电子天平(METTLER TOLEDO公司)。
2方法
2.1样品制备
取若干瓶纤原样品,开盖后置于37℃水浴锅中,通过放置不同的时间,制备出水分含量有一定梯度的样品,样品取出后加盖密封,平衡一段时间。共得到60个样品。
2.2采集近红外光谱
用Antaris Ⅱ傅里叶变换近红外光谱仪的积分球采样模块对60个纤原样品进行光谱采集,扫描范围为10000-4000 cm-1,分辨率为8 cm-1,扫描次数64次,每小时扫描一次背景。
2.3测定样品水分含量
依据2010版中国药典规定,采用卡尔费休容量滴定法,测定样品的水分含量。测定用KF-4型自动水分测定仪完成,先进行标定,记录10mg蒸馏水所消耗的卡尔费休试剂的体积,然后进行测定,向反应杯中加入一定量的样品粉末,记录滴定至终点时所消耗的卡尔费休试剂的体积,最后通过计算得到样品的水分含量。
2.4划分校正集和验证集
采用K-S分类的方法将样品划分为校正集和验证集,二者的比例为2:1,得到40个校正集样品和20个验证集样品。
2.5预处理方法的选择
通过对原始光谱数据进行平滑、微分等预处理,可消除仪器背景或基线漂移等对光谱的影响。本次建模过程考察了MSC、SNV、一阶导数SG11点平滑、二阶导数SG11点平滑,以及MSC、SNV分别和二阶导数联用的多种方法,依据处理后的建模结果确定最终使用的方法。
2.6选择光谱区间
通过光谱变量的筛选,可去除大量的无关变量,大大减少建模的计算量,节省时间。本次建模过程考察了相关系数法和iPLS两种变量选择的方法,并依据模型的结果确定最终的光谱区间。
3结果
3.1样品的水分含量测定结果
依据药典三部附录VIID 水分测定法第一法,测得60个样品的水分含量范围为1.7244-7.2012,将其作为建模用的一级数据。
3.2纤原样品的近红外光谱
图1为积分球漫反射模块采集的60个样品的光谱。从图中可以看出,样品的近红外光谱谱带较宽且重叠严重,而且基线漂移比较严重,不能从光谱直接得到样品水分含量的信息,需要采用化学计量学的方法对光谱进行处理和信息提取,最终建立水分含量的定量分析模型。
图1 原始光谱图
3.3校正集和验证集的划分结果
用K-S分类的方法将样品进行划分,选择40个样品作为校正集,20个样品作为验证集。如图2所示,样品均匀的分布在主成分空间中,其中灰色的点代表校正集样品,红色的点代表验证集的样品,验证集样品较为均匀的分布在校正集样品之中,满足划分的要求。
图2 样品集PC1&PC2得分图
3.4异常样品的剔除
用学生化残差-杠杆值分布图来进行异常样品的甄别。图3为校正集样品的学生化残差-杠杆图,图中未发现学生化残差值和杠杆值过大的样品,说明校正集中无异常点。
图3 校正集样品的学生化残差-杠杆图
3.5预处理方法的选择
本研究分别采用了MSC、SNV、一阶导数SG11点平滑、二阶导数SG11点平滑,以及MSC、SNV分别和二阶导数联用的预处理方法,对光谱数据进行处理。图4为经过不同的预处理方法后所建立的PLS模型的结果,模型的具体参数在表1中进行了列举。从图和表中可以看出,若不进行预处理,原始光谱所建立的模型基本不具有线性,预测能力非常差;经MSC、SNV和一阶导数处理后的光谱数据,建模结果有所改善,但模型性能仍然达不到要求;光谱经二阶导数处理,以及MSC或SNV与二阶导数同时使用时,所建立的模型具有较高的线性,相对较低的RMSECV和RMSEP值,满足建模要求。最终选择模型RMSEP值最低的MSC+二阶导数SG11点平滑的预处理方法。
(a)无预处理时建模结果
(b)MSC处理后建模结果
(c)SNV处理后建模结果
(d)一阶导数SG11点平滑处理后建模结果
(e)二阶导数SG11点平滑处理后建模结果
(f)SNV与二阶导数SG11点平滑联用
(g)SNV与二阶导数SG11点平滑联用
图4 不同预处理后的建模结果
表1 不同预处理方法对建模的影响
预处理方法 | R2 | RMSEC | RMSECV | RMSEP | PCs |
原始光谱 | 0.017 | 1.6265 | 1.6571 | 1.4419 | 1 |
MSC | 0.424 | 1.2500 | 1.5028 | 0.8494 | 5 |
SNV | 0.424 | 1.2502 | 1.5030 | 0.8488 | 5 |
一阶导数SG平滑 | 0.617 | 1.0250 | 1.6177 | 0.6838 | 5 |
二阶导数SG平滑 | 0.950 | 0.0703 | 1.7036 | 0.6277 | 8 |
MSC+二阶导数 | 0.955 | 0.0712 | 1.7459 | 0.5909 | 8 |
SNV+二阶导数 | 0.955 | 0.0712 | 1.7468 | 0.5911 | 8 |
3.6光谱区间选择方法
确定了MSC+二阶导数SG11点平滑的预处理方法后,对光谱变量进行筛选,选择特征光谱区间进行建模。主要采用相关系数法和iPLS两种方法进行光谱区间的选择。
3.6.1相关系数法选择结果
本研究采用相关系数法对预处理后的光谱进行建模区间的选择,计算光谱的各个变量与水分含量之间的相关系数,得到的结果如图5所示。相关系数越大说明该波数点代表的水分含量信息越多,选择相关系数绝对值大于0.4的部分建立模型,图6为经相关系数法得到的用于最终模型建立的光谱变量选择结果,图中蓝色的线表示原始近红外平均光谱图,红色的点代表被选作用于建模的变量点,经波段选择后参与建模的波数点大大降低,由1557个减少为53个。图7为选择变量后所建立模型的结果,可以看到,模型的RMSECV值有较为明显的降低,但其他参数都有所变差,说明在变量选择过程中丢失了较多的有效信息。
图5 相关系数图
图6相关系数法变量选择结果
图7 相关系数法建模结果图
3.6.2iPLS选择结果
本研究采用Forward iPLS的方法选择光谱区间。每个间隔宽度为100个变量,一共约15个间隔,然后用每个间隔进行PLS模型的建立,根据每个子区间得到的RMSECV值选择一个或多个间隔用于最终PLS定量分析模型的建立。最终选择的结果如图8所示,红色虚线代表全光谱建模的RMSECV值,绿色部分代表最终选择用来建模的区间,红色部分为没有参与建模的区间。图9显示了用选择的光谱区间进行建模的结果,模型的RMSECV值有明显的降低,但是线性和RMSEP值有所增大,说明单纯以RMSECV值作为评价标准可能导致有效信息的丢失。
图8 Forward iPLS光谱区间选择结果
图9 iPLS选择光谱区间建模结果图
3.6.3小结
通过采用相关系数和iPLS两种方法选择光谱变量,在MSC+二阶导数的预处理基础上建立PLS模型,各个模型的评价参数如表2所示。从表中可以看出,通过变量选择,模型的RMSECV值都有所降低,说明可以减少过拟合的风险,但是随着有效信息的丢失,模型的线性和预测能力也都有所下降,通过综合考察,本研究最终选择相关系数法选择的变量建立PLS模型,模型的RMSECV值大大降低,而线性和预测误差虽有所变差,但维持在可接受的范围内。
表2 不同变量筛选方法比较
波段选择方法 | R2 | RMSEC | RMSECV | RMSEP | PCs |
无 | 0.955 | 0.0712 | 1.7468 | 0.5911 | 8 |
相关系数 | 0.881 | 0.4426 | 0.8370 | 0.6311 | 5 |
iPLS | 0.872 | 0.1562 | 1.0519 | 0.9855 | 8 |
4讨论
本研究采用近红外光谱分析技术,建立了纤维蛋白原冻干产品中水分含量的PLS定量模型,可准确、快速地预测产品的水分含量。在研究过程中,首先制备了水分含量有一定梯度的样品,共60个,用积分球漫反射模块采集其近红外光谱,然后用卡尔费休容量滴定法测定每个样品的水分含量作为一级数据。在建立模型的过程中,考察了MSC、SNV、一阶导数、二阶导数以及多种方法同时使用等预处理方法,对比了相关系数法和iPLS两种光谱变量选择方法,最终依据所建立模型的参数优劣确定使用的方法为MSC+二阶导数进行预处理,相关系数法选择光谱区间,模型的各项参数为:R2=0.881,RMSEC=0.4426,RMSECV=0.8370,RMSEP=0.6311。此结果表明近红外光谱分析技术可以有效的对纤原冻干产品的水分含量进行测定,证实了该方法的有效性和可行性。
近红外光谱分析技术,克服了传统卡氏水分测定方法的繁琐、耗时等缺点,大大提高了效率。同时,此模型可作为在线监控纤原冻干过程水分含量的基础,将冻干设备进行相关的改造后,借助光纤可实现产品水分含量的实时监测,从而极大地优化冻干过程。
参考文献
倪道明. 血液制品 (第三版) . 北京: 人民卫生出版社, 2013.
马会利, 冯军, 陈纪林等. 人纤维蛋白原结构和功能研究进展. 四川生理科学杂志, 2002, 24(2): 53-7.
VELIK-SALCHNER C, HAAS T, INNERHOFER P, et al.The effect of fibrinogen concentrate on thrombocytopenia . Journal of thrombosisand haemostasis : JTH, 2007, 5(5): 1019-25.
何英武,吴瑞玲.血浆纤维蛋白原测定的方法进展及临床意义. 现代中西医结合杂志,2004, 13(18): 2511-2.
Li L, DingB, Yang Q, et al. The relevance study of effective information between nearinfrared spectroscopy and chondroitin sulfate in ethanol precipitation process. J Innov Opt Heal Sci, 2014,07(06): 1450022.
Wang P, ZhangH, Yang H, et al. Rapid determination of major bioactive isoflavonoid compoundsduring the extraction process of kudzu (Pueraria lobata) by near-infraredtransmission spectroscopy .Spectrochim Acta A Mol Biomol Spectrosc, 2015, 137: 1403-1408.
Zhang XB, Feng YC, Hu CQ. Feasibility andextension of universal quantitative models for moisture content determinationin beta-lactam powder injections by near-infrared spectroscopy . Anal Chim Acta, 2008, 630(2): 131-140.