当前位置: 仪器信息网 > 行业主题 > >

红外技术建模方法

仪器信息网红外技术建模方法专题为您提供2024年最新红外技术建模方法价格报价、厂家品牌的相关信息, 包括红外技术建模方法参数、型号等,不管是国产,还是进口品牌的红外技术建模方法您都可以在这里找到。 除此之外,仪器信息网还免费为您整合红外技术建模方法相关的耗材配件、试剂标物,还有红外技术建模方法相关的最新资讯、资料,以及红外技术建模方法相关的解决方案。

红外技术建模方法相关的论坛

  • 近红外方法建模问题求助。

    一般来讲,如果使用pls建模得到的预测结果与测量值相关度在0.97左右是不是可以说使用呢,这样的建模效果能否说是成功呢?因为我看到很多材料上这个相关度在0.998左右,所以心里没有底。请大牛指导,不胜感谢。 另外,一般对于[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]的预处理方法除了导数法以外,还有别的么?谢谢。

  • 【原创大赛】基于“吸光度-浓度变化率”波段选择方法提高近红外光谱建模能力

    【原创大赛】基于“吸光度-浓度变化率”波段选择方法提高近红外光谱建模能力

    [align=center][b]基于“吸光度-浓度变化率”波段选择方法提高[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]建模能力[/b][/align][url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]定量分析是一种二级分析方法,利用校正模型对未知含量或性质参考值的样品基于[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]数据进行预测,以测定未知待测样品的浓度或性质参考值,根据预测结果评价模型的预测能力和有效性。由于[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]吸收峰严重重叠,信号吸收较弱,背景干扰严重。因此需要运用波段选择方法提取有效波段,常用的波段选择方法包括前向间隔偏最小二乘法(forwardintervalpartialleastsquares, FiPLS)、反向间隔偏最小二乘法(backwardintervalpartialleastsquares, BiPLS),相关系数法(correlationcoefficient, CC)和无信息变量消除算法(uninformativevariableelimination, UVE)等。本实验对近红外建模物质的浓度与吸光度的变化率进行研究,提出了新的波段选择方法:“吸光度-浓度变化率”方法(Ratioof absorbance to concentration,RATC),弥补了常用波段选择的缺陷,构建了血浆蛋白含量检测模型。1材料1.1试剂血浆样品(山东泰邦生物制品有限公司,中国);去离子水。1.2仪器和软件AntarisⅡ傅里叶变换[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url],液体采样附件;液体玻璃小管(4×50mm,KimbleChase 德国);Matlab2015a(美国Mathworks公司);PLS_Toolbox工具箱(美国EigenvectorResearch)。2方法2.1光谱采集采用傅里叶变换[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url](Antaris II FT-NIR)液体温控透射采样模块,控制温度为37℃下,采集原料人血浆样品光谱。光谱扫描范围和分辨率为10000-4000cm[sup]-1[/sup]和8cm[sup]-1[/sup],扫描次数为32次,参比为空气,每隔1小时校正背景。实验室环境为温度26℃,湿度30%。2.2 校正集验证集划分方法需要划分校正集和验证集的样品:原料人血浆样品20份,[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]建模属性为总蛋白含量值;2.3 数据处理及模型建立研究采用MATLAB2015a数学软件以及PLS_Toolbox 1.95工具箱对光谱数据进行处理,对建模物质的吸光度和浓度进行变化率分析,选出用于建模的波数点,针对[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]分析技术的建模分析,以验证均方根误差(RMSEP)值作为其建模预测能力的主要指标。通过讨论不同物质的[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]分析模型建模结果,验证所提波段选择方法的可行性和应用性。3 “吸光度-浓度变化率”波段选择原理及方法本文提出了一种[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]模型的波段选择方法,基于“吸光度浓度变化率”对校正样品集中所有样品进行波段选择,其具体过程为:步骤1:预先设定校正样品集中共有n个样品,每个样品光谱中共有N个变量,对于校正样品集所有样品来说,每个变量则有n个吸光值和n个浓度值;其中,N和n均为大于1的正整数;步骤2:依次计算每个变量下相邻样品的吸光值差值和浓度差值的比值V,最终在每个变量下得到(n-1)个比值V,再计算所有比值V的平均值V[sub]mean[/sub];V[sub]i[/sub]=|(A[sub]i[/sub]-A[sub]i[/sub][sub]+[/sub][sub]1[/sub])|/(C[sub]i[/sub]-C[sub]i[/sub][sub]+[/sub][sub]1[/sub]) (1)V[sub]mean[/sub]=[img=,50,50]https://bbs.instrument.com.cn/xheditor/xheditor_skin/blank.gif[/img] (2)A[sub]i[/sub]表示第i个样品的吸光值,A[sub]i[/sub][sub]+[/sub][sub]1[/sub]表示第i+1样品的吸光值;C[sub]i[/sub]表示第i个样品的浓度值,C[sub]i[/sub][sub]+[/sub][sub]1[/sub]表示第i+1个样品的浓度值;V[sub]1[/sub]表示第1个样品与其相邻的第2个样品的吸光值差值和浓度差值的比值;V[sub]2[/sub]表示第2个样品与其相邻的第3个样品的吸光值差值和浓度差值的比值;V[sub]3[/sub]表示第3个样品与其相邻的第4个样品的吸光值差值和浓度差值的比值;V[sub]4[/sub]表示第4个样品与其相邻的第5个样品的吸光值差值和浓度差值的比值;V[sub]n[/sub][sub]-[/sub][sub]1[/sub]表示第n-1个样品与其相邻的第n个样品的吸光值差值和浓度差值的比值。步骤3:对于校正样品集中样品光谱的N个变量来说,得到N个V[sub]mean[/sub]值,将N个变量按照其V[sub]mean[/sub]值进行排序;步骤4:按照V[sub]mean[/sub]值由大变小的顺序依次选择出相应变量,直至所有变量全部选完,停止建模,记录所有情况的建模结果。其中,V[sub]mean[/sub]值越大,则代表吸光值因浓度变化所产生的响应越大,同时V[sub]mean[/sub]即为所提出的波段选择方法的关键值,命名为“吸光度-浓度变化率”值。从V[sub]mean[/sub]值最大的变量开始建模,随后按照V[sub]mean[/sub]值由大变小的顺序,采取依次增加一个变量的方法,开始建立[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]模型,简化流程图如图4-1所示。[align=center][img=,580,560]https://ng1.17img.cn/bbsfiles/images/2019/08/201908161623164821_3386_3237657_3.png!w580x560.jpg[/img][/align][align=center]图4-1“吸光度-浓度变化率”波段选择方法简化流程图[/align]具体应用例证如图4-2所示:校正样品集有20个样品,其浓度值分别为C[sub]1[/sub],C[sub]2[/sub],…,C[sub]20[/sub]。[align=center][img=,670,461]https://ng1.17img.cn/bbsfiles/images/2019/08/201908161623371131_5892_3237657_3.png!w670x461.jpg[/img][/align][align=center]图4-2“吸光度-浓度变化率”波段选择方法具体例证过程[/align]本文将所提出的波段选择方法用于血浆蛋白含量检测模型的构建中,讨论血浆蛋白含量变化同样品吸光度之间的变化率,进而选择合适的波段用于建模。[b]4 实验结果4.1 近红外建模样品集划分[/b]对三种样品进行校正集和验证集的划分结果如表4-1所示,其结果全部满足验证集的参数值范围在校正集之内,同时对于不同样品的不同属性的校正集和验证集来说,其平均值和标准偏差值也比较接近,满足[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]建模校正集和验证集的划分要求。[align=center]表4-1不同样品不同属性的校正集验证集数据统计结果[/align] [table][tr][td] [align=center]样品[/align] [align=center](检测参数) [/align] [/td][td] [align=center]样品集[/align] [/td][td] [align=center]样本数[/align] [/td][td] [align=center]最大值[/align] [/td][td] [align=center]最小值[/align] [/td][td] [align=center]平均值[/align] [/td][td] [align=center]标准偏差[/align] [/td][/tr][tr][td=1,2] [align=center]原料人血浆[/align] [align=center](蛋白含量值)[/align] [/td][td] [align=center]校正集[/align] [/td][td] [align=center]15[/align] [/td][td] [align=center]76.80[/align] [/td][td] [align=center]40.56[/align] [/td][td] [align=center]59.34[/align] [/td][td] [align=center]12.31[/align] [/td][/tr][tr][td] [align=center]验证集[/align] [/td][td] [align=center]5[/align] [/td][td] [align=center]73.16[/align] [/td][td] [align=center]41.89[/align] [/td][td] [align=center]57.56[/align] [/td][td] [align=center]11.65[/align] [/td][/tr][tr][td=1,2] [align=center]玉米[/align] [align=center](水分值)[/align] [/td][td] [align=center]校正集[/align] [/td][td] [align=center]60[/align] [/td][td] [align=center]10.99[/align] [/td][td] [align=center]9.38[/align] [/td][td] [align=center]10.22[/align] [/td][td] [align=center]0.39[/align] [/td][/tr][tr][td] [align=center]验证集[/align] [/td][td] [align=center]20[/align] [/td][td] [align=center]10.94[/align] [/td][td] [align=center]9.64[/align] [/td][td] [align=center]10.27[/align] [/td][td] [align=center]0.36[/align] [/td][/tr][tr][td=1,2] [align=center]玉米[/align] [align=center](蛋白质含量值)[/align] [/td][td] [align=center]校正集[/align] [/td][td] [align=center]60[/align] [/td][td] [align=center]3.83[/align] [/td][td] [align=center]3.09[/align] [/td][td] [align=center]3.50[/align] [/td][td] [align=center]0.18[/align] [/td][/tr][tr][td] [align=center]验证集[/align] [/td][td] [align=center]20[/align] [/td][td] [align=center]3.82[/align] [/td][td] [align=center]3.18[/align] [/td][td] [align=center]3.48[/align] [/td][td] [align=center]0.18[/align] [/td][/tr][tr][td=1,2] [align=center]玉米[/align] [align=center](油脂值)[/align] [/td][td] [align=center]校正集[/align] [/td][td] [align=center]60[/align] [/td][td] [align=center]9.71[/align] [/td][td] [align=center]7.66[/align] [/td][td] [align=center]8.73[/align] [/td][td] [align=center]0.53[/align] [/td][/tr][tr][td] [align=center]验证集[/align] [/td][td] [align=center]20[/align] [/td][td] [align=center]9.60[/align] [/td][td] [align=center]8.11[/align] [/td][td] [align=center]8.49[/align] [/td][td] [align=center]0.32[/align] [/td][/tr][tr][td=1,2] [align=center]玉米[/align] [align=center](淀粉值)[/align] [/td][td] [align=center]校正集[/align] [/td][td] [align=center]60[/align] [/td][td] [align=center]66.47[/align] [/td][td] [align=center]62.83[/align] [/td][td] [align=center]64.62[/align] [/td][td] [align=center]0.90[/align] [/td][/tr][tr][td] [align=center]验证集[/align] [/td][td] [align=center]20[/align] [/td][td] [align=center]65.60[/align] [/td][td] [align=center]63.63[/align] [/td][td] [align=center]64.91[/align] [/td][td] [align=center]0.48[/align] [/td][/tr][tr][td=1,2] [align=center]汽油[/align] [align=center](辛烷值)[/align] [/td][td] [align=center]校正集[/align] [/td][td] [align=center]45[/align] [/td][td] [align=center]89.60[/align] [/td][td] [align=center]83.40[/align] [/td][td] [align=center]87.15[/align] [/td][td] [align=center]1.57[/align] [/td][/tr][tr][td] [align=center]验证集[/align] [/td][td] [align=center]15[/align] [/td][td] [align=center]88.70[/align] [/td][td] [align=center]84.50[/align] [/td][td] [align=center]87.25[/align] [/td][td] [align=center]1.46[/align] [/td][/tr][/table][b]4.2 血浆样品[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]建模结果4.2.1“吸光度-浓度变化率”方法在血浆蛋白含量建模中的应用[/b]利用“吸光度-浓度变化率”方法对血浆样品进行数据分析,得到每个波数点下的V[sub]mean[/sub]值如图4-3所示,按照其V[sub]mean[/sub]值由大到小排列波数点,依次递增波数点个数进行建模,即得到不同[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]模型结果。[align=center][img=,653,353]https://ng1.17img.cn/bbsfiles/images/2019/08/201908161624210201_7336_3237657_3.png!w653x353.jpg[/img][/align][align=center]图4-3血浆样品不同波数点的V[sub]mean[/sub]值[/align][url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]血浆蛋白含量建模结果如图4-4所示,最小的RMSEP值为0.495,模型的RPD值为23.535>3,无模型过拟合现象,所涉及变量数为50个,具体波数点如表4-2所示。获得最佳模型的波数点大部分都分布在6200-6400cm[sup]-[/sup][sup]1[/sup],分析此处的特征吸收峰信息,多为N-H的一级倍频信息。[align=center][img=,653,353]https://ng1.17img.cn/bbsfiles/images/2019/08/201908161625411205_2487_3237657_3.png!w653x353.jpg[/img][/align][align=center]图4-4 血浆蛋白样品[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]分析技术的建模结果[/align][align=center]表4-2血浆蛋白样品进行[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]分析技术的建模变量[/align] [table][tr][td] [align=center]波数(cm[sup]-[/sup][sup]1[/sup])[/align] [/td][td] [align=center]波数(cm[sup]-[/sup][sup]1[/sup])[/align] [/td][td] [align=center]波数(cm[sup]-[/sup][sup]1[/sup])[/align] [/td][td] [align=center]波数(cm[sup]-[/sup][sup]1[/sup])[/align] [/td][td] [align=center]波数(cm[sup]-[/sup][sup]1[/sup])[/align] [/td][/tr][tr][td] [align=center]6363.940[/align] [/td][td] [align=center]6360.083[/align] [/td][td] [align=center]6321.514[/align] [/td][td] [align=center]6294.515[/align] [/td][td] [align=center]6267.517[/align] [/td][/tr][tr][td] [align=center]6367.797[/align] [/td][td] [align=center]6387.082[/align] [/td][td] [align=center]6317.657[/align] [/td][td] [align=center]6414.080[/align] [/td][td] [align=center]6425.651[/align] [/td][/tr][tr][td] [align=center]6371.654[/align] [/td][td] [align=center]6390.938[/align] [/td][td] [align=center]6313.800[/align] [/td][td] [align=center]6417.937[/align] [/td][td] [align=center]6263.660[/align] [/td][/tr][tr][td] [align=center]6356.226[/align] [/td][td] [align=center]6340.798[/align] [/td][td] [align=center]6402.509[/align] [/td][td] [align=center]6290.658[/align] [/td][td] [align=center]6259.803[/align] [/td][/tr][tr][td] [align=center]6375.511[/align] [/td][td] [align=center]6336.941[/align] [/td][td] [align=center]6309.943[/align] [/td][td] [align=center]6286.801[/align] [/td][td] [align=center]7208.608[/align] [/td][/tr][tr][td] [align=center]6352.369[/align] [/td][td] [align=center]6329.228[/align] [/td][td] [align=center]6406.366[/align] [/td][td] [align=center]6282.944[/align] [/td][td] [align=center]6255.946[/align] [/td][/tr][tr][td] [align=center]6348.512[/align] [/td][td] [align=center]6333.084[/align] [/td][td] [align=center]6306.086[/align] [/td][td] [align=center]6421.794[/align] [/td][td] [align=center]6429.508[/align] [/td][/tr][tr][td] [align=center]6379.368[/align] [/td][td] [align=center]6398.652[/align] [/td][td] [align=center]6302.229[/align] [/td][td] [align=center]6279.087[/align] [/td][td] [align=center]6252.089[/align] [/td][/tr][tr][td] [align=center]6383.225[/align] [/td][td] [align=center]6394.795[/align] [/td][td] [align=center]6410.223[/align] [/td][td] [align=center]6275.230[/align] [/td][td] [align=center]7204.751[/align] [/td][/tr][tr][td] [align=center]6344.655[/align] [/td][td] [align=center]6325.371[/align] [/td][td] [align=center]6298.372[/align] [/td][td] [align=center]6271.374[/align] [/td][td] [align=center]6433.365[/align] [/td][/tr][/table][b]4.2.2 同常规波段选择方法的[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]建模比较[/b]为考察“吸光度-浓度变化率”方法的预测能力高低,将其同其他常规变量选择方法 (FiPLS, BiPLS, CC, UVE) 对相同光谱数据进行处理,建立的近红外模型结果对比如图4-5所示。从图4-5中可明显看出,同其他变量选择方法相比,RATC得到了最小的RMSEP值(RMSEP=0.495g/L)。综上所述,对于原料人血浆样品的总蛋白定量来说,RATC方法减少了参与[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]建模的变量数,提高了血浆蛋白含量建模的预测能力,是一种有效的变量选择方法。[align=center][img=,622,370]https://ng1.17img.cn/bbsfiles/images/2019/08/201908161626000014_401_3237657_3.png!w622x370.jpg[/img][/align][align=center]图4-5 不同血浆蛋白含量的[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]建模结果比较[/align][align=center][b] [/b][/align][b]5小结[/b]本文基于吸光度浓度变化率来对校正样品集中所有样品进行波段选择;其过程为:预先设定校正样品集中共有n个样品,每个样品光谱中共有N个变量,对于校正样品集所有样品来说,每个变量则有n个吸光值和n个浓度值;其中,N和n均为大于1的正整数;依次计算每个变量下相邻样品的吸光值差值和浓度差值的比值V,最终在每个变量下得到(n-1)个比值V,再计算所有比值V的平均值V[sub]mean[/sub];对于校正样品集中样品光谱的N个变量,得到N个V[sub]mean[/sub]值,将N个变量按照其V[sub]mean[/sub]值进行排序;按照V[sub]mean[/sub]值由大变小的顺序依次选择出相应变量,直至所有变量全部选完,停止建模,记录所有情况的建模结果。同常规波段选择方法比较,该方法从三个方面进行了改进,不仅减少了参与[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]建模变量的数目,提高了[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]模型的预测能力。丰富了[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]模型的波段选择方法,给[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]模型使用者提供“吸光度-浓度变化”波段选择方法。同时由于是根据物质的[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]吸光度和浓度的关系建立的波段选择方法,某种程度上,该方法更能够反应物质的化学信息,即吸光度随着浓度变化率,使得该波段选择方法具有广泛的可行性和通用性。

  • 在线近红外的建模?

    在线的近红外分析仪,测量工艺管道里面的液体成分(2种成分),必须要建模吗?建模是什么意思呢?我听朋友介绍,建模时,工程师在要在现场呆1-2年的时间,真的如此吗?在线近红外的价格大致在什么价格?(像测2种比较简单的成分)

  • 请教高手近红外无损检测建模问题

    近红外无损检测建模时会遇到对模型建立的方法选择,其中有一个是散射及标准化处理方法的选择,根据电脑软件的分析,我的建模结果是不做散射及标准化处理得到的R值最大,请问大家下,这个不做散射及标准化处理的好处是什么,或者说不对光谱做处理对模型有哪些好处呢

  • 【讨论】有人做红外建模吗?

    老板非常想用红外来解决定量的问题。我们是食品工业,原料里的组成成分太多。用红外作定量的话,我查了一下,只有用建模的方法,用化学计量法软件去做定量。我这几年来一直做红外定性,对化学计量法还只停留在上学时的两堂介绍化学计量法的课里。不知道有没有在做?用在工业上可行吗?我们可能有液相色谱的数据,但是我们没有经验不知道怎么做?有人能指点一二吗?

  • 【资料】近红外光谱分析中建模样品优选方法的研究

    [url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]分析中建模样品优选方法的研究 作者:王丽杰,郭建英,徐可欣 摘要:结合牛奶成分[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]测量系统的实例,在已定的浓度范围内针对牛奶中脂肪、蛋白质、乳糖三成分采用正交设计法优选参与建模的样品。研究中首次利用正交表的“正交性”原理优选建模样品,并针对牛奶中脂肪浓度的测量采用偏最小二乘(PLS)回归方法交互验证方式建立模型。在此基础上,将正交设计样品集与常规方法选择的样品集的脂肪PLS模型的预测结果进行了对比。实验结果表明:采用正交设计样品集与常规样品集分别建立的PLS模型的预测偏差之差低于0.02g/100g,上述两种方法PLS模型的实际预测浓度与参考浓度之差均集中在0.1g/100g,而后者样品数量约为前者的七倍。进一步的实验结果表明:从常规样品集的样品中随机抽取与正交设计样品集的样品数量相同的样品作为随机样品集并建模,其PLS模型的预测偏差高于常规方法的两倍、相关系数相对较低,并且其实际预测浓度与参考浓度之差集中在0.4g/100g。关键词:近红(NIR)光谱分析;正交设计法;正交性;牛奶;偏最小二乘(PI )回归引言 [url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]的数据处理分析通常由三部分构成:建模样品(校正集样品)的选择及光谱的预处理、定性或定量模型的建立、未知样品组成或性质的预测。由于校正集样品的选择及其基础数据测量的准确性直接关系到所建模型的适用性和测试结果的准确性,因此,校正集样品的选择是[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]数据处理及分析的关键环节。 校正集样品的选择过程中,样品的光谱特征及其性质范围应能涵盖以后未知样品的光谱特征。为保证校正模型的稳健性,校正集的样品数一般不应低于50个,且在所测的浓度或性质范围内,样品的个数应该是均匀分布的【l】。通常校正集样品的确定有常规选择和计算机识别两种方法【l】。常规选择是根据样品光谱的积累和性质或组成数据的分布来选择建立校正集的样品,并通过部分样品进行验证。计算机识别则是纯粹通过确定的计算模型,用计算机来识别所采集样品的光谱间差距,确定适合校正集的样品。依照常规方法建立校正样品集,其最大缺点是必须积累大量的样品以供选择。而计算机识别方法在很大程度上减少了常规方法测量基础数据的样品数,降低了建模费用,但仍然存在一定的缺陷:1)仍然要收集大量的样品谱图以便于判断选择;2)有些光谱的差异并非完全由所测样品的组成或性质差异引起,可能是某些随机因素如样品的温度、粒径大小、物粒形态等因素的差异造成;3)对不同的性质在最佳样品集的选择上可能存在差异,而仅从光谱的差异上有时难以体现;4)对那些含量较低的成分,其量的变化对整个谱图而言往往并不明显,此时如光谱处理方法不合理,也难以选出合适的样品集。 针对上述情况,研究中首次提出了一种利用正交表的“正交性”原理优选校正集样品的方法,并结合牛奶的[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]测量的实例对其可行性进行了探讨,该方法的研究对于光谱分析中校正集样品的优化选择具有重要的研究价值。1 校正样品集选择方法 正交设计法是以相关专业知识及概率论和数理统计为基础,利用数学上的“正交性”原理编制并已标准化的表格——正交表来科学安排试验方案、并对试验结果进行计算、分析、找出最优或较优的条件的数学方法。 利用正交表安排试验方案搭配均衡具有代表性,因为对全体因素而言,正交设计是一种部分试验,但对于其中任何两个因素而言确是带有等重复的全面试验。由于正交试验设计要求任何两个因素是全面试验,因此试验点在优选区的分布是均匀分布的,每个试验点都有强烈的代表性,能够比较全面地反映优选区内的大致情况,并能保证主要因素的各种可能搭配都不会漏掉。 研究中采用正交表的“正交性”原理选择校正集样品。结合牛奶成分[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]测量系统的开发(系统测量原理图见图1所示),采用L8l 9 3正交表进行校正集样品优选。根据牛奶中脂肪、蛋白质及乳糖等成分浓度的常规范围确定相应浓度(单位:g/100g)范围分别为:脂肪:2.5~5.5,蛋白质:2.8~4.8,乳糖:4.4~5.4。在上述浓度范围内,根据典型样品浓度特性设计脂肪、蛋白质及乳糖3因素、9水平(脂肪:2.5、2.87、3.24、3.61、3.98、4.35、4.72、5.09、5.46,蛋白质:2.8、3.05、3.3、3.55、3.8、4.05、4.3、4.55、4.8,乳糖:4.4、4.52、4.64、4.76、4.88、5、5.12、5.24、5.36)浓度分配方案,共计81个样品。不考虑成分因素间的交互作用,采用上述方案选择校正样品集样品的脂肪、蛋白质及乳糖三成分浓度空间散点图见图2,其中脂肪与蛋白质两成分散点图见图3。(图略)2 实验与数据分析 采用自制系统样机,针对不同区域、不同种类、不同季节及不同哺乳时期奶牛的牛奶漫反射光谱进行收集整理,共得407个样品光谱。将其作为备用样品集,从中选取与正交设计方案中的样品浓度最接近的样品共计61个(以脂肪为准)作为正交设计校正样品集。然后,针对正交设计校正样品集和全校正样品集(将407个样品全部作为校正集样品)采用偏最d'-乘(PLS)方法交互验证方式分别建立脂肪的校正模型,并应用这两种模型分别对全部407个样品的脂肪浓度进行实际预测,交互验证及实际预测参数见表1,407个样品中脂肪浓度的实际预测值与参考值间的对比结果见表2。 从表l可以看出:正交设计校正样品集与全校正样品集的交互验证结果中,交互验证相关系数 相差0.0038、交互验证均方根偏差(Root Mean Square Error ofCross Validation,RMSECV)相差0.0195,预测相关系数 相差o.0032、预测均方根偏差(Rot Mean Square Error ofPrediction,RMSEP)相差0.0173。采用PLS校正模型分别对全部407个样品进行实际预测时,相关系数 相差0.0015、RMSEP相差0.0112。从表2可以看出:正交设计校正样品集与全校正样品集对所有407个样品的实际预测浓度与参考浓度间的偏差均集中在O.1g/100g左右。表l、表2同时列出了全部样品中随机选取的61个样品作为校正集(称为随机校正样品集)的PLS1模型的交互验证结果及其对全部407个样品的实际预测结果,从中可以看出随机校正样品集的预测偏差是全校正样品集的预测偏差的两倍、相关系数相对降低,并且随机校正样品集对所有407个样品的实际预测浓度与参考浓度间的偏差集中在0.4左右。3 小结 实验结果表明:正交设计校正样品集与全校正样品集的预测偏差之差在0.02g/100g以内,实际预测浓度与参考浓度间的偏差均集中在O.1g/100g左右,而正交设计校正样品集中样品数量是全校正样品集的样品数量的七分之一。进一步的实验结果表明:随机校正样品集的预测偏差是全校正样品集预测偏差的两倍、且相关系数相对降低,其实际预测浓度与参考浓度间的偏差集中在0.4g/100g左右。 可见,正交设计校正集样品(61个)在全部样品中具有代表性,如果将81个样品光谱全部收集作为正交设计校正样品集,预计预测偏差将会进一步缩小。因此,利用正交表的“正交性”原理进行建模过程中校正集样品的优选具有实用性,该方法的研究不仅为[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]分析中校正集样品的优选提供了可参考的方法,而且对于校正模型的优化及提高测试结果的准确性等方面均具有重要的意义。

  • 【求助】近红外建模问题

    [em04] 哪位高手帮忙一下啊? 我刚接触近红外分析仪,想知道,没有建立分析模型的情况下,直接做样,再建模型分析数据 还是先把模型建立好,再做样呢?

  • [求助]关于饲料原料的近红外建模的一些意见和建议

    [em58] 师妹要做饲料原料近红外建模的课题,请各位大虾介绍一点意见和建议~!如果有这方面的相关文章就更好了~!万分感谢~!据说FOSS公司在这方面的技术很成熟,希望能得到高人指点~!QQ:446310489E-mail:lijing_63@yahoo.com.cn

  • 【原创】推荐大家几本关于matlab建模参考书和近红外方面的参考书

    关于matlab建模问题,对于初学者可以推荐以下参考书,以下参考书我在近红外光谱群都有上传,《MATLAB神经网络43个案例分析》、《MATLAB遗传算法工具箱及应用》、《MATLAB小波分析与应用》、《支持向量机:理论、算法与拓展》、《神经网络与机器学习》、《化学化工中的数学方法及MATLAB实现》。关于近红外参考书可以看下《近红外光谱分析的原理、技术与应用》、《近红外光谱分析技术及其在现代农业中的应用》、《近红外光谱法快速分析药品》、《化学计量学方法与分子光谱分析技术》。

  • 近红外建模

    使用unscrambler进行建模,光谱数据需要jcamp-dx格式,但是我的光谱数据是excel格式的,请问大神们有什么方法转换吗,我用的是海洋光学的仪器,软件保存jcamp-dx格式出来时jdx形式的,无法用软件打开,请问该怎么办

  • 姜的成分分析及建模中的一些问题

    大家好,我是一名教师,以前专业为电子技术(本科)和控制理论与工程(研究生),现从事的是自动化专业的教学,去年考博后(本校的,农科院校),导师让做近红外分析的课题(没商量的余地),初步定为姜的成分分析及建模。我粗看了几本书和一些论文,有下面几个问题向大家请教:1、姜的成分很复杂(化学成分100~200种),适不适合用近红外来分析?如果能做,应为干的粉末效果最好、其次是切片?所用的附件有哪些?能不能做无损检测?2、建模过程为先用传统方法得到各化学成分含量,扫描得到近红外光谱图,由两者用化学计量法得到模型。这样理解不知是否正确?关键问题,不知道由两者得到模型的具体过程。望各位不吝赐教!谢谢!

  • 【原创大赛】基于近红外光谱分析技术的2,3,5-三甲基氢醌干燥失重的建模研究

    【原创大赛】基于近红外光谱分析技术的2,3,5-三甲基氢醌干燥失重的建模研究

    [align=center][b]基于[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]分析技术的2,3,5-三甲基氢醌干燥失重的建模研究[/b][/align][align=left][b]中文摘要:目的[/b]在传统的真空干燥过程中,工作人员在不同时间点多次采样,离线分析产品干燥失重,从而了解产品的干燥状态。干燥不足难以清除产品中水分与有机溶剂,需要重新抽真空延长干燥时间,期间就增加了产品暴露于空气中的时间,造成产品的氧化损失。过度干燥无疑又会浪费能源。传统方法费时费力,并且损失产品,因此研究简便快速的干燥失重分析测试与监控方法具有很大应用前景。[b]方法[/b]采用[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]分析技术结合PLS算法建立TMHQ真空干燥过程水分含量的监控模型,考察多种预处理方法与波段选择方法对模型进行优化。[b]结果[/b]建立模型的各项参数为:RMSEC=0.0893,RMSECV=0.0943,RMSEP=0.0798,R[sup]2[/sup]C=0.9713,R[sup]2[/sup]P=0.9832。[b]结论[/b]所建立的方法,模型重复性与预测能力良好,可以满足TMHQ生产中真空干燥过程水分含量快速检测,以判断干燥终点。[/align][align=left][b]关键词:[/b][url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]分析;2,3,5-三甲基氢醌;干燥2, 3, 5-三甲基氢醌(TMHQ)是合成维生素 E的重要中间体,可与异植醇缩合生产维生素 E。TMHQ 在空气中极易被氧化,其主要来源为人工合成以及从石油化工等行业的下脚料中提取。提取方法因工艺复杂、产率较低及产品纯度不高等问题,极大地限制了其应用范围 而人工合成方法因其原料易得、工艺相对简单、转化率高等优点获得了广泛应用。TMHQ干燥终点的确定在合成中起到关键作用。在制药领域,NIRS作为一种重要的PAT工具,已成功用于药物的原辅料评价、关键过程的监测和控制、成品的快速放行和质量监测等各个环节,为保证产品质量、降低生产成本、革新生产过程发挥了重要的作用。[/align][b]1 实验仪器与试剂1.1 仪器[/b] Antaris Ⅱ傅里叶变换[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url](美国Thermo Fisher公司),光纤采样附件(美国SabIR),SHB-III循环水式多用真空泵(郑州长城科工贸有限公司),BT224S电子分析天平(德国Sartorius公司),ZKXFB-2真空干燥箱(上海树立仪器仪表有限公司),扁形称量瓶(40×25mm),圆底烧瓶、布氏漏斗、抽滤瓶。RESULT[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]采集软件,TQAnalyst[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]分析软件,Matlab数据处理软件。[b]1.2 试剂[/b] TMBQ(安耐吉试剂公司,含量99%),10%钯碳催化剂(国药集团化学试剂有限公司),无水乙醇(天津富宇精细化工),氢气(济南德祥)。[b]2 方法2.1TMHQ样品的制备[/b] 20ml无水乙醇溶解2gTMBQ纯品,加入到100ml两口圆底烧瓶中,加入钯碳催化剂,使用三通连接氢气气囊,封口膜密封连接处,隔膜泵抽尽圆底烧瓶内空气,再通入氢气,重复操作三次。25℃下磁力搅拌反应。反应结束后,旋蒸浓缩至剩余少量液体,蒸馏水洗涤瓶壁上产品,减压过滤后45℃真空干燥12h,称重计算产率。利用钯碳氢气还原2,3,5-三甲基苯醌得到TMHQ,反应完毕,使用硅藻土过滤除去钯碳,旋蒸过滤液得白色粉末及片状固体,依次用适量蒸馏水与石油醚快速洗涤。将湿样品分装于11个称量瓶中,放置在真空干燥箱中干燥。干燥箱保持恒温45℃,每隔0.5h取出装有样品的称量瓶,冷却至室温,称重并采集光谱。每个称量瓶中的样品采集11-13次光谱。[b]2.2TMHQ干燥失重的测定[/b] 根据2,3,5-三甲基氢醌化工行业标准(HG/T4415-2012)规定,测定TMHQ样品的干燥失重,取本品2.0~2.5g,在105℃条件下烘干至重量不再变化,水分平行测定结果应不大于0.20%,取其算数平均值。 干燥失重=(m1-m2)/(m1-m0)*100%,m1为干燥前重量,m2为干燥后重量,m0为瓶重。[b]2.3TMHQ[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]的采集[/b] 设置波长范围4000 cm[sup]-1[/sup]-10000cm[sup]-1[/sup];扫描次数32次;分辨率8 cm[sup]-1[/sup],使用光纤附件漫反射方式采谱,采集样品前采集背景以消除背景干扰,每个样品重复采集三次光谱。环境温度20℃,湿度60%。[b]2.4样品集划分[/b] 以8个批次为校正集,3个批次为验证集,并根据主成分得分图验证校正集与验证集样品是否分布均匀。[b]2.5异常样本的剔除[/b] 采用主成分分布图和学生残差-杠杆值同时判别异常离群样本,并予以剔除。[b]2.6预处理方法选择[/b] 主要考察一阶导数、二阶导数、MSC、SNV四种预处理方法,并与无预处理的建模结果进行对比,选择出最优预处理方法。[b]2.7特征波段选择[/b] 使用最优预处理方法对原始光谱预处理,消除基线漂移与仪器噪声,考察GA算法、iPLS算法、与人工选择波段三种方法选择特征波段的建模效果。[b]2.8重复性考察[/b] 选择3个验证集样品,每个样品连续采集10次光谱,使用建立好的模型预测每张光谱,并计算出每个样品十次预测值的均值和标准偏差。[img=,18,27]http://bbs.instrument.com.cn/xheditor/xheditor_skin/blank.gif[/img]是第i个样品的第j张光谱,第i个样品共测定ri个光谱,第i个样品的预测平均值为:[align=center][img=,111,86]http://ng1.17img.cn/bbsfiles/images/2017/08/201708310935_01_1626619_3.png[/img][/align] 复测定的标准偏差为:[align=center][img=,185,83]http://ng1.17img.cn/bbsfiles/images/2017/08/201708310936_01_1626619_3.png[/img][/align] 用c[sup]2[/sup]检验来考察这些重复性标准偏差是否属于同一总体:[align=center] [img=,288,60]http://ng1.17img.cn/bbsfiles/images/2017/08/201708310939_01_1626619_3.png[/img][img=,249,48]http://bbs.instrument.com.cn/xheditor/xheditor_skin/blank.gif[/img][/align][align=center] [img=,89,55]http://ng1.17img.cn/bbsfiles/images/2017/08/201708310939_02_1626619_3.png[/img][img=,58,48]http://bbs.instrument.com.cn/xheditor/xheditor_skin/blank.gif[/img][/align][align=center][img=,128,60]http://ng1.17img.cn/bbsfiles/images/2017/08/201708310940_01_1626619_3.png[/img][/align][align=center][img=,196,54]http://ng1.17img.cn/bbsfiles/images/2017/08/201708310940_02_1626619_3.png[/img][/align] z为需要重复测定的样品数,将所得χ[sup]2[/sup]与自由度(z-1)临界值比较,若χ[sup]2[/sup]在临界值以下,则重复测定的所有方差属于同一总体,标准偏差均值σ可以作为近红外测定的标准偏差,近红外分析方法的重复性为z××σ[sub]max[/sub]。如果χ[sup]2[/sup]大于临界值,近红外分析方法的重复性随样品组分浓度不同而不同,这时,近红外分析方法的重复性不大于z××σ[sub]max[/sub](σ[sub]max[/sub]为σi中的最大值)。[b]3结果3.1样品集划分[/b] 选择8个批次共88个样品为校正集,3个批次共39个样品为验证集。所有样品的主成分分布图如图1。 [img=,552,195]http://ng1.17img.cn/bbsfiles/images/2017/08/201708311015_01_1626619_3.png[/img][align=center]图1 样品第一第二主成分分布图[/align] 其中黑色标记代表校正集样品,红色标记为验证集样品,验证集样品均匀分布于校正集中,表明验证计划分合理,可以用于建立模型。[b]3.2异常样品的判别[/b] 图2为校正集样品学生残差-杠杆值分布图,图为所有样品主成分分布图,图3中椭圆虚线内的范围为95%置信范围。由两图中可见17号样品杠杆值非常高,并且超出主成分95%置信范围,判断其为异常点,予以剔除。[img=,40,30]http://bbs.instrument.com.cn/xheditor/xheditor_skin/blank.gif[/img] [b][img=,690,235]http://ng1.17img.cn/bbsfiles/images/2017/08/201708310946_01_1626619_3.png[/img][/b][align=center]图2 学生残差-杠杆值分布图[/align][img=,41,24]http://bbs.instrument.com.cn/xheditor/xheditor_skin/blank.gif[/img] [b][img=,690,235]http://ng1.17img.cn/bbsfiles/images/2017/08/201708310947_01_1626619_3.png[/img][/b][align=center]图3 95%置信范围主成分分布图[/align][b]3.3预处理方法考察[/b] 图4为所有样品原始光谱,由于对固体样品采用光纤漫反射的采谱方式,固体颗粒对光的散射作用导致基线漂移严重。分别采用一阶导数、二阶导数、MSC、SNV四种方法对原始光谱预处理,谱图如图5。经过预处理后基线漂移都得到很好的改善,并且有吸收差异的特征波段凸现出来,为波段选择提供了参考。经过导数处理的光谱基线更加平坦,出现的尖峰表示原始光谱中相互重叠多重峰在求导后已明显分离。表1为使用以上预处理方法建立PLS模型后的评价参数汇总。[align=center][img=,397,182]http://ng1.17img.cn/bbsfiles/images/2017/08/201708311031_01_1626619_3.png[/img][/align][align=center]图4 原始[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]图[/align] [align=center] [img=,690,416]http://ng1.17img.cn/bbsfiles/images/2017/08/201708310949_01_1626619_3.png[/img]a[img=,690,416]http://ng1.17img.cn/bbsfiles/images/2017/08/201708310949_02_1626619_3.png[/img]b[/align][align=center] [img=,690,416]http://ng1.17img.cn/bbsfiles/images/2017/08/201708310951_01_1626619_3.png[/img]c [img=,690,416]http://ng1.17img.cn/bbsfiles/images/2017/08/201708310951_02_1626619_3.png[/img]d[/align][align=center]图5 经过预处理后的光谱图(自上到下为abcd,a为一阶导数处理,b为二阶导数处理,c为MSC处理,d为SNV处理)[/align][align=center]表1 不同预处理方法建模结果[/align][align=center] [img=,394,136]http://ng1.17img.cn/bbsfiles/images/2017/08/201708310953_01_1626619_3.png[/img][/align] MSC、SNV只是处理谱图数据,而没有考虑浓度阵,因此有可能损失有价值信息,或者对噪声去除不完全。经过求导预处理的的模型评价参数比MSC与SNV要好,其中一阶导数与二阶导数建模效果相差不大,但是一阶导数预处理的RMSEP值最小,预示模型预测值与真实值偏差最小,模型预测能力较强,因此以一阶导数为最佳预处理方法。[b]3.4特征波段的选择3.4.1iPLS方法选择结果[/b] 使用FordwardiPLS方法,最大主成分数设定为20,分别考察以50、100、200个变量为基础的建模效果。红色虚线是全波段建模的RMSECV,红色与绿色条带的高度代表以此条带的变量建模所得RMSECV,从图6中可见,绿色条带的RMSECV值最小,因此绿色条带是被选择用于建模的波段,红色条带则表示不被选择的区域。表2为不同变量基础的模型参数。变量基础为50,所选波段区间为5542 cm[sup]-1[/sup]-5731cm[sup]-1[/sup],变量基础为100,所选波段区间为7085cm[sup]-1[/sup]-7467cm[sup]-1[/sup],变量基础为200,所选波段区间为5542 cm[sup]-1[/sup]-6309cm[sup]-1[/sup]。[align=center][img=,690,316]http://ng1.17img.cn/bbsfiles/images/2017/08/201708310954_01_1626619_3.png[/img][/align][align=center]图6 iPLS算法选择变量结果图(变量基础50)[/align][align=center]表2各变量基础的模型参数[/align][align=center] [img=,575,94]http://ng1.17img.cn/bbsfiles/images/2017/08/201708310955_01_1626619_3.png[/img][/align][b]3.4.2 GA算法选择结果[/b] GA算法以遗传理论与自然选择为理论基础,对于一个光谱矩阵,随机产生一部分子集,计算每个自己的RMSECV,将RMSECV值高的子集舍弃,利用余下的子集繁衍并允许一定的变异率,迭代计算直至达到最低的RMSECV。[align=center] [img=,573,360]http://ng1.17img.cn/bbsfiles/images/2017/08/201708311032_01_1626619_3.png[/img][/align][align=center]图7 GA算法运行结果图[/align] 图7为GA算法运行结果,变异率0.01%,交叉率50%,运行次数100次,重复运行3遍。b图中绿色折线表示最优适应性变化线,蓝色折线代表平均适应性变化线,两折线随迭代次数的增加逐渐相聚,在第21代时交汇,此时选择的变量为最优变量。c图表示变量数目随遗传代数的变化趋势,优势变量在遗传中将被多次采用,而与回归分析无关的变量在遗传筛选中被淘汰,变量总数较最初有所精简。d图表示在第21代时,每个个体平均选择的变量的数量。 图8中使用红色代表高RMSECV,蓝色代表低RMSECV,部分波段只有红色条带而没有蓝色条带,表示这一波段因RMSECV较高而没有被选择,例如图中a区域;图中蓝色条带部分例如b区域RMSECV值较低,在多次遗传迭代中被多次采用,表明这一波段包含较多有效信息。GA算法选出4003.85cm[sup]-1[/sup]-4077.07cm[sup]-1[/sup],4312.13cm[sup]-1[/sup]-4385.35cm[sup]-1[/sup],4543.34cm[sup]-1[/sup]-4616.56cm[sup]-1[/sup],5391.11cm[sup]-1[/sup]-5464.33cm[sup]-1[/sup],7472.00cm[sup]-1[/sup]-7545.22cm[sup]-1[/sup],8319.77cm[sup]-1[/sup]-8392.99cm[sup]-1[/sup],9784.10cm[sup]-1[/sup]-9857.32cm[sup]-1[/sup]7个波段共14个变量,在平均光谱图9中为红色标出部分。[align=center][img=,589,256]http://ng1.17img.cn/bbsfiles/images/2017/08/201708311028_01_1626619_3.png[/img][/align][align=center]图8 GA算法运行结果图[/align][align=center][img=,690,316]http://ng1.17img.cn/bbsfiles/images/2017/08/201708310959_02_1626619_3.png[/img][/align][align=center]图9 GA算法选出的波段区间[/align][b]3.4.3人工选择结果[/b] 算法选择波段更倾向于数学意义,以参数值判断最优区间,对于目标物质的化学意义关注不够,虽然计算准确,但是缺乏灵活性,波段选择略显盲目。因此参考算法选择结果与水的近红外特征吸收人工选择特征波段。[align=center][img=,23,44]http://bbs.instrument.com.cn/xheditor/xheditor_skin/blank.gif[/img][img=,489,201]http://ng1.17img.cn/bbsfiles/images/2017/08/201708311033_01_1626619_3.png[/img][/align][align=center]图10 人工选择变量[/align] 经过基线校正后,原始光谱与一阶导数预处理光谱在4966cm[sup]-1[/sup]-5317cm[sup]-1[/sup],5646cm[sup]-1[/sup]-6000cm[sup]-1[/sup],6787cm[sup]-1[/sup]-7195cm[sup]-1[/sup]吸收差异明显,在图10中为红色方框标注。上述使用iPLS与GA算法选择出的部分波段与这些波段也有交集,两种算法在5000[sup]-1[/sup]-6000[sup]-1[/sup]范围内均有选出波段。通常水的O-H伸缩振动一级倍频吸收在7000cm[sup]-1[/sup]左右,弯曲振动与伸缩振动的组合频在5155cm[sup]-1[/sup]左右,此三处波段与水的特征吸收波段极为相近。以这三个波段单独或组合建模结果如表3,通过对比可见,5646cm[sup]-1[/sup]-6000cm[sup]-1[/sup]与6787cm[sup]-1[/sup]-7195cm[sup]-1[/sup]两个波段组合建模的结果最好。[align=center]表3 人工选择波段模型评价参数[/align][align=center] [img=,572,243]http://ng1.17img.cn/bbsfiles/images/2017/08/201708311003_01_1626619_3.png[/img][/align][b]3.5最终模型[/b] 对比几种方法的评价参数发现,通过人工选择的方法选择变量所建模型的RMSEC、RMSECV最低,R[sup]2[/sup]C最高,说明模型内部预测能力高;而通过iPLS方法选择变量所建模型的RMSEP最低,R[sup]2[/sup]p最高,说明模型对未知样品预测能力强。因此本实验iPLS方法确定的变量建立最终模型。最优模型预测值与HPLC参比值线性关系如图11,。[align=center]表4 不同波段选择方法模型参数对比[/align][align=center] [img=,579,100]http://ng1.17img.cn/bbsfiles/images/2017/08/201708311004_01_1626619_3.png[/img][/align][align=center][img=,690,281]http://ng1.17img.cn/bbsfiles/images/2017/08/201708311005_01_1626619_3.png[/img][/align][align=center]图11 最优模型NIR预测值与HPLC参考值对比图[/align][b]3.6重复性考察[/b] 采集3个验证集样品光谱,对TMBQ含量模型进行重复性测试,每样品采集10次光谱。预测结果见表5。[align=center]表5 重复性考察结果[/align][align=center][img=,573,324]http://ng1.17img.cn/bbsfiles/images/2017/08/201708311006_01_1626619_3.png[/img][/align] 自由度为2时,χ[sup]2[/sup]临界值为5.99。实际χ[sup]2[/sup]小于临界值,[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]分析方法重复性为,可以满足分析应用。[b]3.7模型预测[/b] 通过主成分分析对数据降维,前三个主成分解释了光谱的94.17%的变异,其中第一主成分(PC1)占83.83%,第二主成分(PC2)占7.38%,第三主成分(PC3)占2.96%。PC1能够解释光谱83.83%的变异,解释了大部分光谱信息,其得分随采样时间点的变化可以代表总体样本的变化趋势,如图11。[align=center][img=,460,253]http://ng1.17img.cn/bbsfiles/images/2017/08/201708311007_01_1626619_3.png[/img][/align][align=center]图12 验证集第一主成分得分值变化[/align] 比较验证集样品的参考值与预测值,能够更加清晰观察模型的预测能力,如图12所示,真空干燥过程中,水分含量的参考值与测定值变化趋势一致,数值相差不大,无明显差别,表明模型预测能力良好。 三批次验证集样品6h干燥失重均小于标准规定的0.2%,表明真空干燥6h已达到干燥终点,图13中6h处,水分含量趋近于0,并且曲线不再变化,这与近红外预测值一致。[align=center] [img=,571,365]http://ng1.17img.cn/bbsfiles/images/2017/08/201708311008_01_1626619_3.png[/img][/align][align=center]图13 验证集TMHQ样品水分含量预测结果[/align] 本实验采用[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]分析技术结合PLS算法建立TMHQ真空干燥过程水分含量的监控模型,考察多种预处理方法与波段选择方法对模型进行优化。经考察,模型重复性与预测能力良好,可以满足TMHQ生产中真空干燥过程水分含量快速检测,以判断干燥终点。[b]参考文献[/b]杨礼义, 钱东, 张茂昆. 双金属催化剂催化合成三甲基氢醌工艺研究. 石化技术与应用, 2000,18(2): 68-69.[b][/b] Meng X J, Sun Z H, Lin S, etal. Catalytic hydroxylationof 2, 3, 6-trimethylphenol with hydrogen peroxide over copper hydroxyphosphate(Cu2(OH)PO4). Appl Catal A-Gen,. 2002,236(1): 17.[b][/b]钱东,唐成国,杨礼义等, 2,3,5-三甲基氢醌的合成及其质量的影响因素. 化学试剂, 2001, 23(5), 265~266.[b][/b]杨国红,张玉珍,张茹英。RP—HPLC测定三甲基氢醌的含量. 天然气化工, 2006,31(4): 63-65.[b][/b] WORKMAN等著. [url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]解析实用指南. 褚小立译. 北京 化学工业出版社,2009.[b][/b] Marcelo Blanco a[i],[/i] Miguel Castillo a, RafaelBeneyto. Study of reaction processes by in-line near-infrared spectroscopy incombination with multivariate curve resolution Esterification of myristic acidwith isopropanol. Talanta 2007.72(2), 519-525.[b] [/b]

  • 大家都来看看,近红外定量建模中,先确定预处理还是先确定波段啊 ?

    如题,在近红外定量的建模过程中,是先固定一个波段,然后在确定预处理方法,还是先确定预处理方法在选择优化波段呢?因为不同的预处理方法,软件推荐的 波段是不同的。我用的是TQ软件。大家一起交流啊。这个在写的时候又该怎么写呢。比如说我要优选预处理方法,是先按全波段优选好预处理方法,然后在优化波段吗?

  • 校正样品在建模中的作用是什么?

    [font=宋体][url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]定量分析技术在对样品成分含量进行快速无损检测前,需要利用化学计量学方法建立样品成分与[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]之间的相关关系,称之为校正模型。合理可靠的校正模型建立需要大量具有代表性的样品参与,称之为校正样品,其样品分布范围要广,尽可能包含待分析样品的范围。因此,校正样品的作用主要为建模提供代表性的样品,使建立的模型合理可靠。[/font]

  • 建模对样品数量有哪些要求?

    [font=宋体][font=宋体]建模所需的样品数量与样品情况以及光谱与性质数学关系的复杂程度有关。石化样品尤其是生产过程中的样品往往比较类似,特别在生产比较稳定,原料和操作没有变化的时候,这种情况下应当再多收集一些样品,拓宽性质变化范围。光谱与性质的数学关系比较复杂时,需要更多的样品来解释光谱与性质的关系。应用多元校正方法建立油料样品的近红外模型,对建模的样品数量要求,读者可参考[/font][font=Times New Roman]GB/T 29858-2013[/font][font=宋体]。[/font][/font]

  • 近红外建方法模型

    刚好现在的工作不算多,所以可以做近红外方法开发和建模工作,减轻未来的分析压力。

  • 近红外建模求助

    http://ng1.17img.cn/bbsfiles/images/2014/08/201408151009_510401_2864659_3.bmp采用 the unscrambler 建模,回归后出现的这个图,请问这是怎么回事啊?麻烦各位大神给解释一下,非常感谢!!

  • 【原创大赛】近红外光谱快速检测人血白蛋白原液蛋白质含量的建模研究

    【原创大赛】近红外光谱快速检测人血白蛋白原液蛋白质含量的建模研究

    [url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]快速检测人血白蛋白原液蛋白质含量的建模研究摘要:本研究建立[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]定量分析模型,对浓缩液蛋白含量进行快速及有效的测定。在实验室条件下配置不同浓度的蛋白样品,建立用于蛋白含量测定的定量分析模型,以实现浓缩液蛋白含量的快速及有效的判断。关键词:[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]分析技术;人血白蛋白;定量分析模型1材料1.1 试剂供试品:人血白蛋白原液;生理盐水。1.2 仪器和软件AntarisⅡ傅里叶变换[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url](美国Thermo Fisher scientific公司);内径4×50 mm的玻璃小管(Kimble Chase,德国); MATLAB 2015a(美国Mathworks公司);PLS_Toolbox工具箱(美国Eigenvector Research公司)。2方法2.1 蛋白含量的测定及样品溶液的配制2.1.1 蛋白质含量的测定取生产过程中超滤浓缩后的人血白蛋白原液为实验供试品,用半微量凯氏定氮法测定蛋白质浓度,浓度应不低于26.5%。2.1.2样品溶液的配制根据试验需要,将供试品溶液用生理盐水进行稀释得到多个不同蛋白质浓度的实验样品。2.2 样品光谱的采集本实验使用AntarisⅡ傅里叶变换[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url],采用透射分析模块,采用仪器自带的RESULT-Intergration软件编写采集光谱的工作流程。光谱分辨率为8 cm-1,扫描范围为10000-4000 cm-1,扫描次数为32次,用偏最小二乘回归(Partial Least Squares Regression, PLSR)方法建立定量模型。2.3 校正集和验证集的划分校正集中的样品应包含使用该模型预测的未知样品的所有化学成分。且校正集中的样品的化学成分浓度范围应覆盖使用该模型预测的未知样品中可能存在的浓度范围。而且验证集中的样品应涵盖使用模型分析的待测样品中的化学组成,测定浓度范围也应尽可能覆盖该模型分析的待测样品可能存在的浓度范围,且分布均匀。所以,需要选择合理的样品集划分方法,以提高模型的应用性及准确性。2.4 预处理方法的选择为了消除噪声和产生的基线漂移,提高模型的预测能力,得到稳健的模型,需要在模型建立前对样品的原始光谱进行预处理,常用的谱图处理方法有均值中心化(Mean Center)、标准化(Auto scale)、平滑和导数等。导数是常用的基线校正和光谱分辨预处理方法,但也会放大噪声的信号,降低光谱的信噪比;为消除光谱变换带来的噪声,常对原始光谱进行平滑后求导,能有效提高信噪比;均值中心化可增大不同样品之间的差异,从而使模型的稳健性和预测能力得到提高;标准化可以使光谱中所有波长变量的权重相同,增加光谱之间差异化,适合于低浓度成分的建模。本研究中对Auto scale、Mean Center、一阶导数(First Derivative,FD)SG13点平滑、二阶导数(Second Derivative,SD)SG13点平滑等预处理方法进行了考察,以模型的RMSEP为指标,选择最合适的预处理方法。2.5 光谱区间的选择[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]信息十分复杂,在建立校正模型的过程中选择有效的建模变量是十分必要的。本研究选用间隔偏最小二乘法(Interval Partial Least Squares Regression, iPLS)),以RMSECV值为评价标准,选择变量区间以建立最佳的定量模型。3 实验结果3.1 蛋白质含量的测定结果采用半微量凯氏定氮法进行蛋白含量的测定,测定得到17个样品的蛋白含量。用生理盐水稀释样品,共得到49个不同蛋白质含量的样品。3.2 样品的原始光谱图1为49个蛋白样品的原始光谱,原始光谱图中可见各样品的光谱差异不明显,因此需要使用化学计量学方法对样品光谱进行处理。[align=center][img=,494,237]http://ng1.17img.cn/bbsfiles/images/2017/09/201709151606_01_1626619_3.png[/img][/align][align=center]图1 样品原始光谱图[/align]3.3 校正集和验证集的划分结果本研究采用Kennard-Stone(K-S)分类的算法,按照2:1的比例进行样品集的划分,划分为33个校正集样品和16个验证集样品。图2为校正集样品和验证集样品的主成分得分图,图中灰色点为校正集样品,红色点为验证集样品,从主成分得分图中可以看出,校正集样品和验证集样品分布比较均匀,且验证集样品比较均匀的分布在校正集样品之间,符合理想校正集和验证集的要求。[align=center] [img=,467,301]http://ng1.17img.cn/bbsfiles/images/2017/09/201709151608_01_1626619_3.png[/img][/align][align=center]图2 样品主成分得分图[/align]3.4 光谱预处理的结果建模过程中,分别采用各种方法对光谱数据进行预处理,包括标准化(Auto scale)、均值中心化(Mean Center)、一阶导数(First Derivative,FD)、SG13点平滑、二阶导数(Second Derivative,SD)等处理方法,以RMSEP作为评价模型的参数,通过对比预处理后的建模结果,选出最合适的预处理方法。表1列出了预处理后各模型的评价参数,通过比对,可以较直观的选出一阶导数SG13点平滑和Mean Center的组合为最佳预处理方法。图3所示为用经过一阶导数SG13点平滑和Mean Center 预处理后的光谱所建立的模型的结果,从图3中可以看出,建模效果较好,预测能力较高,Rc2=0.994,Rp2=0.986,RMSEC=0.1993%,RMSEP=0.2585%,RMSECV=0.2518%。[align=center]表1 不同预处理后各模型参数[/align][align=center][img=,629,241]http://ng1.17img.cn/bbsfiles/images/2017/09/201709151613_01_1626619_3.png[/img][/align][align=left]FD+SG:一阶导数+SG13点平滑[/align][align=left]SD+SG:二阶导数+SG13点平滑[/align][align=center][img=,572,305]http://ng1.17img.cn/bbsfiles/images/2017/09/201709151616_01_1626619_3.png[/img][/align][align=center]图3 一阶导数+SG平滑+ Mean Center[/align]3.5 光谱区间的选择结果通过筛选光谱区间,可以选择与样品白蛋白含量相关性大的光谱变量进行建模,去掉大量无关信息,减少模型的计算量,使得模型的效果更好。本实验采用iPLS进行变量的选择。将光谱进行SG13点平滑+一阶导数+ Mean Center预处理后,分别采用Forward iPLS和Reverse iPLS方法选择最佳的光谱区间,改变窗口宽度,分别选择最佳变量,以RMSECV为标准选择谱区。3.5.1Forward iPLS选择波段采用FiPLS的方法以RMSECV为标准选取最佳的光谱区间,分别选择50、100、200个变量进行自动选择,如表2所示窗口宽度为100个变量时建模结果较佳,结果图4所示。[align=center]表2 Forward iPLS结果[/align] [align=center][img=,645,163]http://ng1.17img.cn/bbsfiles/images/2017/09/201709151618_01_1626619_3.png[/img][/align][align=center][img=,517,246]http://ng1.17img.cn/bbsfiles/images/2017/09/201709151619_01_1626619_3.png[/img][/align][align=center]图4 Forward iPLS波段结果图[/align]由图4中可以看出,绿色部分为建模的波段,图5为建模预测结果图。[align=center][img=,551,291]http://ng1.17img.cn/bbsfiles/images/2017/09/201709151620_01_1626619_3.png[/img] [/align][align=center]图5 Forward iPLS建模结果图[/align]3.5.2 Reverse iPLS选择波段采用Reverse iPLS的方法选取最佳的光谱区间,同样,分别选择50、100、200个变量进行自动选择,如表3所示窗口宽度为50个变量时建模结果较佳,波段选择结果如图6所示。[align=center]表3 Reverse iPLS结果[/align][align=center][img=,652,456]http://ng1.17img.cn/bbsfiles/images/2017/09/201709151622_01_1626619_3.png[/img][/align] [align=center]图6 Reserve iPLS 选波段结果图[/align]如图6中所示,其中绿色部分为建模波段,图7为预测结果。[align=center][img=,520,228]http://ng1.17img.cn/bbsfiles/images/2017/09/201709151624_01_1626619_3.png[/img][/align][align=center]图7 Reserve iPLS 建模结果图[/align]通过采用Forward iPLS和Reservei PLS波段选择方法建立PLSR模型,经过两种方法中选择的最优变量的对比(见表4),选择窗口宽度为100变量的Forward iPLS变量选择方法建立的模型最佳。最终建立的PLSR模型结果:模型的参数为Rc2=0.997,Rp2=0.987,均方根误差RMSEC=0.1394%,RMSEP=0.2560%,RMSECV= 0.1831%,建模结果较好。[align=center]表4不同变量选择方法的建模结果[/align][align=center][img=,641,142]http://ng1.17img.cn/bbsfiles/images/2017/09/201709151629_01_1626619_3.png[/img][/align]3.6 一级数据与预测值比较对16个验证集样品的传统方法获得的蛋白含量和NIRS蛋白含量预测值进行偏差分析,结果见表5所示。蛋白含量一级数据和预测值的平均偏差和相对平均偏差的计算公式见式1和式2,蛋白含量NIRS的预测值和一级数据间的平均偏差为0.17,相对平均偏差为0.81,两者都较低,说明了NIRS和传统的凯氏定氮法结果相差较小,表明NIRS用于蛋白含量测定的准确性和可靠性。[align=center][img=,372,89]http://ng1.17img.cn/bbsfiles/images/2017/09/201709151631_01_1626619_3.png[/img][/align]式中yi, actual为传统凯氏定氮方法得到的一级数据值,yi, predicted为NIRS得到的预测值,n为验证集样品数量。[align=center]表5 验证集样品方法结果比较表[/align][align=center][img=,585,86]http://ng1.17img.cn/bbsfiles/images/2017/09/201709151632_01_1626619_3.png[/img][/align]3.7 预测值的精密度通过重复测量光谱计算,建立的蛋白含量校正模型的预测精密度。随机选取验证集样品中的1号、15号、35号、42号和47号样品,每个样品重复测量10次,然后采用建立的蛋白含量模型采集以上样品的光谱,得到样品的预测值。然后计算每个样品预测值的平均值、标准偏差和相对标准偏差,用这些指标来表示预测的精密度,结果见表6。如表中所示, RSD值均在1.0%以下,远远低于5.0%,证明了模型的精密度良好。[align=center]表6 模型精密度考察结果[/align][align=center][img=,584,394]http://ng1.17img.cn/bbsfiles/images/2017/09/201709151636_01_1626619_3.png[/img][/align]4结论和讨论本研究建立了人血白蛋白生产过程中蛋白含量测定的近红外定量模型,用于人血白蛋白原液蛋白质含量的测定,为下一步原液的生产配制提高依据。首先,取生产过程中的样品17个,用凯氏定氮法测得各个样品的蛋白含量,然后在实验室条件下,用生理盐水配制成49个不同浓度的蛋白样品。对49个样品进行[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]的采集,然后对样品进行校正集和验证集的划分,对光谱进行预处理方法和不同的变量选择方法进行了考察;采用Kennard-Stone(K-S)分类的算法,按照2:1的比例进行样品集的划分,优先选出Mean Center +一阶导数SG13点平滑的预处理方法,并采用窗口宽度为100变量的Forward iPLS变量选择方法选出变量区间,最终建立最佳的近红外定量模型。最终建立的PLSR模型结果:Rc2=0.997,Rp2=0.987,均方根误差RMSEC=0.1394%,RMSEP=0.2560%,RMSECV= 0.1831%。除此之外,对模型进行了重复性考察,从结果可知模型具有较好的重复性。在模型的建立中,选用Kennard-Stone(K-S)分类的算法进行样品集的划分,通过PCA分析得到具有代表性的校正集和验证集样品。在预处理方法的选择中,分别选用Autoscale、Mean Center、SG平滑一阶导数以及各预处理方法的组合进行预处理方法的考察,其中SG平滑中,不同的窗口宽度会对平滑产生不同的效果,窗口宽度越宽平滑效果越好,但也会丢掉有用的信息,经过考察选择13点平滑时结果较佳。参考文献吴清, 周法根. 脑梗死治疗中白蛋白应用价值的探讨 . 心脑血管病防治, 2005, 5(2): 49-50.王华平, 米宇俊. 人血白蛋白治疗肾综合征出血热低血压休克患者疗效观察 . 医师进修杂志, 2001, 24(8):20-21.郑红光, 杨志藩, 关欣. 静脉输注人血白蛋白对肾病综合征的正负临窗效应观察 . 中国实用内科杂志, 2003, 23(1):25-27.刘丽萍. 人血白蛋白在肝硬化资料中的应用 . 中国医院用药评价与分析, 2013, 13(5):388-390.常花蕾, 史涛. 人血白蛋白临床不合理应用及改进措施 . 中国药物应用与监测, 2014, 11(1): 52-54.孙世光, 余明莲, 王建民, 张国辉. 人血白蛋白的临床应用误区及其对策 .解放军药学学报, 2009, 25(4):366-368.

Instrument.com.cn Copyright©1999- 2023 ,All Rights Reserved版权所有,未经书面授权,页面内容不得以任何形式进行复制