中文摘要: 目的 利用近红外光谱分析技术,建立原液中总蛋白及纤原含量的检测模型,实现原液的快速检定。 方法 选取超滤完成后配制前原液为研究对象,首先制备了纤原含量有一定梯度的样品,共54个,用透射模块采集其近红外光谱。实验收集生产中大量不同纤原纯度的原液样品,建立能够直接预测原液纤原纯度的近红外定量模型。 结果 模型的各项参数为:R2=0.999,RMSEC=0.3575,RMSECV=0.4894,RMSEP=0.5208。 结论 模型的准确度和精密度较好,可实现原液的快速检定以及在线监测。
关键词:近红外光谱分析;人纤维蛋白原;纤原含量
从验证集中选择3个样品,每个样品分别测定10次光谱,用建立的模型预测其纤原含量,计算每个样品预测值的平均值和标准偏差。用χ2检验考察这些重复性标准偏差是否属于同一总体:
图1纤原样品近红外光谱图
图2样品集PC1&PC2得分图
图3校正集样品的学生化残差-杠杆图
表1不同预处理方法对建模的影响
预处理方法 | R2 | RMSEC | RMSECV | RMSEP | PCs |
原始光谱 | 0.986 | 1.4301 | 1.6954 | 1.3725 | 2 |
Autoscale | 0.996 | 0.7399 | 0.9276 | 0.6983 | 4 |
一阶导数 | 0.993 | 0.9913 | 1.2920 | 0.8967 | 4 |
二阶导数 | 0.991 | 1.0997 | 1.7300 | 1.2479 | 4 |
一阶导数+Autoscale | 0.997 | 0.6325 | 0.8056 | 0.7479 | 4 |
图4一阶导数Autoscale预处理全光谱建模结果图
图5Reverse iPLS选择波段图
图6iPLS选择光谱区间建模结果图
GA是一种通过变量选择使模型的预测能力更准确的方法,它以自然选择和遗传理论为基础,对于一个给定的光谱矩阵,随机产生一定数目的子集,计算每一个子集的RMSECV值,将比RMSECV均值高的一半数目的子集去掉,将剩下的子集进行繁殖并允许一定的变异,重复计算一直到得到的RMSECV值最低为止。
图7所示GA选择光谱区间结果图,图中颜色由红变蓝表示模型的RMSECV值逐渐变小。彩色部分为通过计算筛选出来的光谱区间,空白部分则予以剔除,建模结果如图8所示,决定系数为0.999,RMSEC=0.3575,RMSECV=0.4894,RMSEP=0.5208,模型的性能较全光谱建模也得到了很大提升。
图7GA变量选择结果图
图8GA选择光谱区间建模结果图
预处理后的光谱采用相关系数法进行变量的选择,计算光谱的各个变量与纤原含量之间的相关系数,得到的结果如图9所示。相关系数越大说明该波数点代表的纤原含量信息越多,选择相关系数绝对值大于0.8的部分建立模型,图10为经相关系数法得到的用于最终模型建立的光谱变量选择结果,图中蓝色的线表示原始近红外平均光谱图,红色的点代表被选作用于建模的变量点,经波段选择后参与建模的波数点大大降低,由1557个减少为734个。
图9相关系数图
图10相关系数法变量选择结果
图11为相关系数法所选变量得到的建模结果图,经过变量选择模型的预测能力有所提高,各项参数较全光谱建模也都有所提升。
图11相关系数法建模结果图
通过使用iPLS、GA和相关系数法三种不同的变量选择方法,对用于建模的光谱区间进行选择,用优选出来的区间建立PLS模型,各个模型的评价参数如表2所示。通过比较,可以发现,用GA选择的变量建立PLS模型,模型的性能最佳,所以最终建模使用的方法为一阶导数+Autoscale进行光谱预处理,GA进行光谱区间的选择。
表2不同变量筛选方法比较
波段选择方法 | R2 | RMSEC | RMSECV | RMSEP | PCs |
无 | 0.997 | 0.6325 | 0.8056 | 0.7479 | 4 |
iPLS | 0.998 | 0.5879 | 0.8483 | 0.5235 | 3 |
GA | 0.999 | 0.3575 | 0.4894 | 0.5208 | 5 |
相关系数法 | 0.997 | 0.5780 | 0.7094 | 0.7416 | 3 |
选取验证集样品中的3号、21号和44号,每个样品分别测定10次光谱,用所建模型对其纤原含量进行预测,预测和统计结果如表3所示。
表3重复性结果
预测值 测量次数 | 3号(mg·mL-1) | 21号(mg·mL-1) | 44号(mg·mL-1) |
1 | 45.55 | 28.47 | 14.24 |
2 | 45.67 | 28.36 | 14.23 |
3 | 45.71 | 28.39 | 14.19 |
4 | 45.58 | 28.44 | 14.31 |
5 | 45.47 | 28.52 | 14.36 |
6 | 45.62 | 28.56 | 14.28 |
7 | 45.52 | 28.43 | 14.32 |
8 | 45.49 | 28.36 | 14.21 |
9 | 45.54 | 28.49 | 14.26 |
10 | 45.66 | 28.53 | 14.37 |
平均值 | 45.58 | 28.46 | 14.28 |
标准偏差 | 0.08 | 0.07 | 0.06 |
χ2 | 0.70 | ||
重复性 | z××σ=0.30 |
对于给定95%置信水平,χ2(0.05,2)临界值=5.99,所得的χ2值小于5.99,说明重复测定的所有方差属于同一总体,近红外方法测定样品纤原含量的重复性可按z××σ计算得出,为0.30。
本实验采用近红外光谱分析技术,建立了纤维蛋白原原液中纤原含量的PLS定量模型,可准确、快速地预测原液中的纤原含量,证明了在生产中用近红外方法快速检测原液中纤原纯度是可行的。在研究过程中,首先制备了纤原含量有一定梯度的样品,共54个,用透射模块采集其近红外光谱。建模过程中,最终确立了一阶导数+Autoscale的光谱预处理方法,以及GA的谱区选择方法,建立的模型的各项参数为:R2=0.999,RMSEC=0.3575,RMSECV=0.4894,RMSEP=0.5208,模型的准确度和精密度都非常理想。
实验下一步将在生产过程中收集大量不同纤原纯度的原液样品,以建立能够直接预测原液纤原纯度的近红外定量模型,以实现真正的生产过程实时监控。