当前位置: 仪器信息网 > 行业主题 > >

落体脑模型器

仪器信息网落体脑模型器专题为您提供2024年最新落体脑模型器价格报价、厂家品牌的相关信息, 包括落体脑模型器参数、型号等,不管是国产,还是进口品牌的落体脑模型器您都可以在这里找到。 除此之外,仪器信息网还免费为您整合落体脑模型器相关的耗材配件、试剂标物,还有落体脑模型器相关的最新资讯、资料,以及落体脑模型器相关的解决方案。

落体脑模型器相关的论坛

  • 【原创大赛】模型总体评价及在中试生产中的应用

    【原创大赛】模型总体评价及在中试生产中的应用

    [font='times new roman'][size=16px][b]模型总体评价及在中试生产中的应用[/b][/size][/font][font='times new roman'][size=16px]表为经不同波段选择方法优化后得到的离线模型、在线模型及模型转移后的模型结果,图为相应的模型图。结合表和图得,经[/size][/font][font='times new roman'][size=16px]UVE[/size][/font][font='times new roman'][size=16px]波段选择方法优化后的离线模型结果最好,经[/size][/font][font='times new roman'][size=16px]RATC[/size][/font][font='times new roman'][size=16px]波段选择方法优化后的在线模型结果最好[/size][/font][font='times new roman'][size=16px]。模型转移后的模型经[/size][/font][font='times new roman'][size=16px]RATC[/size][/font][font='times new roman'][size=16px]优化后的结果较在线模型[/size][/font][font='times new roman'][size=16px]预测能力[/size][/font][font='times new roman'][size=16px]有所提高,[/size][/font][font='times new roman'][size=16px][i]R[/i][/size][/font][font='times new roman'][size=16px][i]2[/i][/size][/font][font='times new roman'][size=16px][i]c[/i][/size][/font][font='times new roman'][size=16px],[/size][/font][font='times new roman'][size=16px] [/size][/font][font='times new roman'][size=16px][i]R[/i][/size][/font][font='times new roman'][size=16px][i]2[/i][/size][/font][font='times new roman'][size=16px][i]cv[/i][/size][/font][font='times new roman'][size=16px], RMSEC[/size][/font][font='times new roman'][size=16px],[/size][/font][font='times new roman'][size=16px] RMSECV[/size][/font][font='times new roman'][size=16px]分别为[/size][/font][font='times new roman'][size=16px]0.970[/size][/font][font='times new roman'][size=16px],[/size][/font][font='times new roman'][size=16px]0.960[/size][/font][font='times new roman'][size=16px],[/size][/font][font='times new roman'][size=16px]1.9053[/size][/font][font='times new roman'][size=16px],[/size][/font][font='times new roman'][size=16px]2.1918[/size][/font][font='times new roman'][size=16px],[/size][/font][font='times new roman'][size=16px]达到了实验预期的目的。这可能是由于模型转移后消除或者减轻了基线漂移、随机噪声等对光谱的干扰从而提高了光谱的质量。[/size][/font][align=center][font='times new roman']表[/font][font='times new roman']离线模型、在线模型及模型转移后的模型结果比较[/font][/align][table][tr][td=3,2][align=center][font='times new roman']模型参数[/font][/align][/td][td=5,1][align=center][font='times new roman'][color=#000000]波段选择方法[/color][/font][/align][/td][/tr][tr][td][align=center][font='times new roman'][color=#000000]raw[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]CC[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]VIP[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]RATC[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]UVE[/color][/font][/align][/td][/tr][tr][td=2,4][align=center][font='times new roman']离线模型[/font][/align][/td][td][align=center][font='times new roman'][color=#000000]R[/color][/font][font='times new roman'][size=13px][color=#000000]2[/color][/size][/font][font='times new roman'][size=13px][color=#000000][i]c[/i][/color][/size][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.971[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.98[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.969[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.967[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.977[/color][/font][/align][/td][/tr][tr][td][align=center][font='times new roman'][color=#000000]R[/color][/font][font='times new roman'][size=13px][color=#000000]2[/color][/size][/font][font='times new roman'][size=13px][color=#000000][i]cv[/i][/color][/size][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.961[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.972[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.952[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.954[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.973[/color][/font][/align][/td][/tr][tr][td][align=center][font='times new roman'][color=#000000]RMSEC[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]1.8904[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]1.5631[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]2.0328[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]2.0398[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]1.6776[/color][/font][/align][/td][/tr][tr][td][align=center][font='times new roman'][color=#000000]RMSECV[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]2.2385[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]1.8712[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]2.1722[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]2.1996[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]1.8588[/color][/font][/align][/td][/tr][tr][td=2,4][align=center][font='times new roman']在线模型[/font][/align][/td][td][align=center][font='times new roman'][color=#000000]R[/color][/font][font='times new roman'][size=13px][color=#000000]2[/color][/size][/font][font='times new roman'][size=13px][color=#000000][i]c[/i][/color][/size][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.962[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.956[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.94[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.957[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.963[/color][/font][/align][/td][/tr][tr][td][align=center][font='times new roman'][color=#000000]R[/color][/font][font='times new roman'][size=13px][color=#000000]2[/color][/size][/font][font='times new roman'][size=13px][color=#000000][i]cv[/i][/color][/size][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.961[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.954[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.939[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.954[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.961[/color][/font][/align][/td][/tr][tr][td][align=center][font='times new roman'][color=#000000]RMSEC[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]2.5356[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]2.3997[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]2.7244[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]2.3103[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]2.4073[/color][/font][/align][/td][/tr][tr][td][align=center][font='times new roman'][color=#000000]RMSECV[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]2.5412[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]2.4103[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]2.7286[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]2.3143[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]2.4189[/color][/font][/align][/td][/tr][tr][td=2,4][align=center][font='times new roman']模型转移[/font][/align][/td][td][align=center][font='times new roman'][color=#000000]R[/color][/font][font='times new roman'][size=13px][color=#000000]2[/color][/size][/font][font='times new roman'][size=13px][color=#000000][i]c[/i][/color][/size][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.96[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.965[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.96[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.[/color][/font][font='times new roman'][color=#000000]970[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.96[/color][/font][/align][/td][/tr][tr][td][align=center][font='times new roman'][color=#000000]R[/color][/font][font='times new roman'][size=13px][color=#000000]2[/color][/size][/font][font='times new roman'][size=13px][color=#000000][i]cv[/i][/color][/size][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.95[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.959[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.952[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.[/color][/font][font='times new roman'][color=#000000]960[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]0.954[/color][/font][/align][/td][/tr][tr][td][align=center][font='times new roman'][color=#000000]RMSEC[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]2.2368[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]2.0946[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]2.246[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]1.9053[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]2.2329[/color][/font][/align][/td][/tr][tr][td][align=center][font='times new roman'][color=#000000]RMSECV[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]2.5009[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]2.3404[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]2.4808[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]2.[/color][/font][font='times new roman'][color=#000000]1918[/color][/font][/align][/td][td][align=center][font='times new roman'][color=#000000]2.4188[/color][/font][/align][/td][/tr][tr][td=8,1][align=center][img]https://ng1.17img.cn/bbsfiles/images/2020/09/202009170831236047_8320_3890113_3.png[/img][/align][/td][/tr][tr][td=8,1][align=center][font='times new roman'][b]([/b][/font][font='times new roman'][b]a)[/b][/font][/align][/td][/tr][tr][td=8,1][align=center][img]https://ng1.17img.cn/bbsfiles/images/2020/09/202009170831240070_2959_3890113_3.png[/img][/align][/td][/tr][tr][td=8,1][align=center][font='times new roman'][b]([/b][/font][font='times new roman'][b]b)[/b][/font][/align][/td][/tr][tr][td=8,1][align=center][img]https://ng1.17img.cn/bbsfiles/images/2020/09/202009170831240256_4670_3890113_3.png[/img][/align][/td][/tr][tr][td=8,1][align=center][font='times new roman'][b]([/b][/font][font='times new roman'][b]c)[/b][/font][/align][/td][/tr][tr][td=8,1][align=center][font='times new roman'] [/font][font='times new roman']经过优化后的[/font][font='times new roman']模型[/font][font='times new roman']结果图[/font][font='times new roman']([/font][font='times new roman']a[/font][font='times new roman'])[/font][font='times new roman'] [/font][font='times new roman']优化后的[/font][font='times new roman']离线[/font][font='times new roman']模型[/font][font='times new roman'];[/font][font='times new roman']([/font][font='times new roman']b[/font][font='times new roman'])[/font][font='times new roman']优化后的在[/font][font='times new roman']线模型[/font][font='times new roman'];[/font][font='times new roman']([/font][font='times new roman']c[/font][font='times new roman'])[/font][font='times new roman']模型转移后建模结果)[/font][/align][/td][/tr][/table][font='times new roman'][size=16px][b]模型验证[/b][/size][/font][font='times new roman'][size=16px]利用模型转移后得到[/size][/font][font='times new roman'][size=16px]光谱建立的模型[/size][/font][font='times new roman'][size=16px]经过[/size][/font][font='times new roman'][size=16px]RATC[/size][/font][font='times new roman'][size=16px]波段选择优化后在中试流化床混合过程中实时监测[/size][/font][font='times new roman'][size=16px]API[/size][/font][font='times new roman'][size=16px]的含量,使用[/size][/font][font='times new roman'][size=16px]Micro[/size][/font][font='times new roman'][size=16px] [url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]NIR[/color][/url] [/size][/font][font='times new roman'][size=16px]Pro v2.3[/size][/font][font='times new roman'][size=16px]导入[/size][/font][font='times new roman'][size=16px]PLS[/size][/font][font='times new roman'][size=16px]模型监测[/size][/font][font='times new roman'][size=16px]API[/size][/font][font='times new roman'][size=16px]理论含量分别为[/size][/font][font='times new roman'][size=16px]90%[/size][/font][font='times new roman'][size=16px],[/size][/font][font='times new roman'][size=16px]100%[/size][/font][font='times new roman'][size=16px],[/size][/font][font='times new roman'][size=16px]11[/size][/font][font='times new roman'][size=16px]0%[/size][/font][font='times new roman'][size=16px]时混合过程[/size][/font][font='times new roman'][size=16px]API[/size][/font][font='times new roman'][size=16px]的含量。为了评估实时监测结果的准确性,在混合后期每[/size][/font][font='times new roman'][size=16px]60[/size][/font][font='times new roman'][size=16px] s[/size][/font][font='times new roman'][size=16px]在混合过程中采集样品[/size][/font][font='times new roman'][size=16px]([/size][/font][font='times new roman'][size=16px]约[/size][/font][font='times new roman'][size=16px]3[/size][/font][font='times new roman'][size=16px] [/size][/font][font='times new roman'][size=16px]g)[/size][/font][font='times new roman'][size=16px],用于离线数据的采集。通过离线测量数据与在线[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]法的预测数值比较,评价了模型的预测能力,结果如图所示。图中绿色的曲线代表经过[/size][/font][font='times new roman'][size=16px][url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]NIR[/color][/url]S[/size][/font][font='times new roman'][size=16px]模型预测得到的[/size][/font][font='times new roman'][size=16px]API[/size][/font][font='times new roman'][size=16px]含量,橙色的点表示通过离线取样测得的[/size][/font][font='times new roman'][size=16px]API[/size][/font][font='times new roman'][size=16px]含量,从图中可以看出,两种方法之间有很好的相关性,[/size][/font][font='times new roman'][size=16px]API[/size][/font][font='times new roman'][size=16px]含量的近红外实时监测值和真[/size][/font][font='times new roman'][size=16px]实[/size][/font][font='times new roman'][size=16px]值整体[/size][/font][font='times new roman'][size=16px]拟合[/size][/font][font='times new roman'][size=16px]较好,但离线测量值较大,造成监测值和离线测量值差异[/size][/font][font='times new roman'][size=16px]的原因可能包括混合过程中物料状态变化异常、在线定量模型的预测精度不够、测定的一级数据有偏差等。此外,从图[/size][/font][font='times new roman'][size=16px]可以看出,近红外检测器能够及时地感知到[/size][/font][font='times new roman'][size=16px]吹扫装置进行吹扫(红色箭头处)、添加物料(红色椭圆处)、停机等造成的异常状况,这种便携的近红外传感器具有很大的在线监测潜力,可以用于流化床在线[/size][/font][font='times new roman'][size=16px]API[/size][/font][font='times new roman'][size=16px]含量的监测。[/size][/font][table][tr][td][/td][/tr][tr][td][img]https://ng1.17img.cn/bbsfiles/images/2020/09/202009170831241291_1773_3890113_3.png[/img][/td][/tr][tr][td][img]https://ng1.17img.cn/bbsfiles/images/2020/09/202009170831243557_9929_3890113_3.png[/img][/td][/tr][tr][td][align=center][font='times new roman']图在线[/font][font='times new roman']API[/font][font='times new roman']定量分析模型检测结果[/font][font='times new roman'])[/font][/align][/td][/tr][/table][font='times new roman'][size=18px][b]小结[/b][/size][/font][font='times new roman'][size=16px]本研究中对流化床混合过程离线光谱与在线光谱模型转移进行研究,经过模型转移后的结果对比,发现[/size][/font][font='times new roman'][size=16px]PRS[/size][/font][font='times new roman'][size=16px]模型转移后,模型准确性有所提高。为模型转移方法的应用体系和技术突破提供了参考价值,达到了预期的结果。对比预处理方法后,选择[/size][/font][font='times new roman'][size=16px]FD+SG3+SNV+meancenter[/size][/font][font='times new roman'][size=16px]为最优的预处理方法,模型的[/size][/font][font='times new roman'][size=16px][i]R[/i][/size][/font][font='times new roman'][size=16px]2[/size][/font][font='times new roman'][size=16px][i]c[/i][/size][/font][font='times new roman'][size=16px],[/size][/font][font='times new roman'][size=16px][i]R[/i][/size][/font][font='times new roman'][size=16px]2[/size][/font][font='times new roman'][size=16px][i]cv[/i][/size][/font][font='times new roman'][size=16px],[/size][/font][font='times new roman'][size=16px]RMSEC[/size][/font][font='times new roman'][size=16px]和[/size][/font][font='times new roman'][size=16px]RMSECV[/size][/font][font='times new roman'][size=16px]分别为[/size][/font][font='times new roman'][size=16px]0.960[/size][/font][font='times new roman'][size=16px],[/size][/font][font='times new roman'][size=16px]0.950[/size][/font][font='times new roman'][size=16px],[/size][/font][font='times new roman'][size=16px]2.2368[/size][/font][font='times new roman'][size=16px]和[/size][/font][font='times new roman'][size=16px]2.5009[/size][/font][font='times new roman'][size=16px]。[/size][/font][font='times new roman'][size=16px]对比离线、在线和模型转移[/size][/font][font='times new roman'][size=16px]后的[/size][/font][font='times new roman'][size=16px]建模[/size][/font][font='times new roman'][size=16px]结果[/size][/font][font='times new roman'][size=16px],经过模型转移后[/size][/font][font='times new roman'][size=16px]参数[/size][/font][font='times new roman'][size=16px]RMSECV[/size][/font][font='times new roman'][size=16px]值与离线模型相比升高,但是与在线模型相比下降,这说明模型转移[/size][/font][font='times new roman'][size=16px]策略[/size][/font][font='times new roman'][size=16px]提高了在线模型的建模结果。为了考查和对比模型转移的结果,建立了离线、在线及模型转移后建立的模型,并对比了相关系数、[/size][/font][font='times new roman'][size=16px]VIP[/size][/font][font='times new roman'][size=16px]、[/size][/font][font='times new roman'][size=16px]RATC[/size][/font][font='times new roman'][size=16px]、[/size][/font][font='times new roman'][size=16px]UVE[/size][/font][font='times new roman'][size=16px]光谱波段选择方法。此外,将模型转移后建立的模型用于中试混合在线监测,[/size][/font][font='times new roman'][size=16px]API[/size][/font][font='times new roman'][size=16px]含量的近红外实时监测值和真实[/size][/font][font='times new roman'][size=16px]值整体[/size][/font][font='times new roman'][size=16px]拟合较好。此外,近红外检测器能够及时地测量出吹扫装置进行吹扫(红色箭头处)、添加物料(红色椭圆处)、停机等造成的异常状况,这种便携的近红外传感器可以用于流化床在线[/size][/font][font='times new roman'][size=16px]API[/size][/font][font='times new roman'][size=16px]含量的监测。通过模型转移,降低了建模成本,提高了模型的准确性。[/size][/font]

  • 【转帖】晶体结构立体模型建构软件 Diamond

    在使用Diamond软件构造晶体模型时,需要知道晶体的结构数据,即晶体的空间群、晶胞参数和原子坐标。晶体结构数据可以手动输入,也可以直接从晶体信息文件中获得。我们将通过几个例子来说明软件的使用方法。[img]http://www.instrument.com.cn/bbs/images/affix.gif[/img][url=http://www.instrument.com.cn/bbs/download.asp?ID=130595]晶体结构立体模型建构软件-Diamond的使用指南.pdf[/url]

  • 近红外仪器间模型转移

    目前,模型转移比较容易在同一品牌型号仪器间实现模型转移,不同品牌,或同一品牌不同型号仪器间模型转移较为困难,即使实现模型转移,转移模型预测误差也较大,大家有何想法,欢迎踊跃讨论

  • 【金秋计划】食品保质期预测常用模型及应用

    [align=center] [/align] [font=宋体, SimSun][size=15px][color=#48494d]目前在食品和饮料产品上标明的保质期通常为消费者提供了一个粗略的指南,告诉他们在既定加工、包装、运输和储存条件下该产品的货架寿命。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]但在实际产品生命链条中,储存条件、运输对包装的破坏等因素的改变可能会使产品的实际保质期短于或长于产品预期的保质期,从而导致与食品安全和浪费相关的问题。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]因此保质期预测和评估的进展对提高食品供应的安全性、可靠性和可持续性起到至关重要的作用。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]在保质期预测方法中选择合适的动力学模型和数据分析技术是至关重要的,可以根据环境条件的变化,更加准确的预测产品使用寿命,还可以进行实时监控。本文梳理了基于品质衰变原理的保质期预测方法。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]近年来,国内外学者利用动态模型研究了肉制品、蔬菜、水果等的品质变化,并对其贮藏期进行预测,取得了较好的结果。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]通过分析影响产品质量变化的主要因素确定用于货架期结束的关键指标,形成基于品质衰变原理的货架期预测方法体系。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]食品品质变化由内在品质性质因素Ci表示(如浓度、pH 值、水分活度等)与外在环境因素Ej表示(如温度、相对湿度、包装等)决定,食品品质衰变可表示为:rQ=f(Ci,Ej)。食品品质衰变一般包括化学品质衰变、微生物生长动力和食品感官失效三个方面的改变。[/color][/size][/font] [font=宋体, SimSun][color=#007aaa][b][size=15px]1.化学品质衰变动力学模型[/size][/b][/color][/font] [font=宋体, SimSun][size=15px][color=#48494d]食品劣变大多由化学反应引起的食品,一般采用化学品质衰变动力学模型来进行保质期预测。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]常用的化学品质衰变动力学模型为阿伦尼乌斯模型(Arrhenius 模型)。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]阿伦尼乌斯模型应用于脂肪氧化、美拉德反应、蛋白质变性等易被化学反应破坏的食品。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]一般来说,温度越高,化学反应的速度越快,这意味着产品质量下降的速度越快。Q10 模型侧重于温度对货架期的影响,而导致其预测精度比较低,在Arrhenius 模型中,用Q10 这个概念来确定温度对反应的敏感程度。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]食品保质期的损失通常通过测量特征质量指数A随时间t的变化来评估,通常表示为f(A)=k(T)t,其中f(A)为食品的质量函数,k 为反应速率常数。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]速率常数是绝对温度T 的逆指数函数,由Arrhenius阿伦尼乌斯表达式给出,k=kAexp(–EA/RT),其中kA为常数,EA为控制质量损失的反应活化能,R为通用气体常数。根据以下拟合方程,可以推算货架终点产品品质:[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]–d[A]/dt=k[A]n,–d[b]/dt=k′[b]n′[/b][/b][/color][/size][/font][b][b] [font=宋体, SimSun][size=15px][color=#48494d]式中:k 和k′为品质变化速率常数;[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]n 和n′为反应级数;[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]d[A]/dt 和d/dt 为品质变化速率。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]化学指标A(如营养素或特征风味)的损失或不期望的化学指标B(异味成分或褪色色素含量)[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]若满足A 或B 与时间t 的线性拟合,则为零级模式;[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]若满足A 或B 半对数与t 的线性拟合,则为一级模式;[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]若满足1/A 或1/B 与t 的线性拟合,则为二级模式。[/color][/size][/font] [font=宋体, SimSun][color=#007aaa][b][size=15px]2.微生物生长动力学模型[/size][/b][/color][/font] [font=宋体, SimSun][size=15px][color=#48494d]微生物腐烂是食品变质的主要方式之一,特别是对新鲜或最低限度加工的冷藏产品。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]微生物可引起食物腐败或引起食源性疾病。研究表明微生物导致的食品腐烂,主要是食品贮藏中的特定腐败菌(specific spoilage organisms,SSO)活动导致的,并且微生物菌群不是静态的,随着不同品类食品内在因素和外界环境因素发生改变,其增长态势是预测食品货架期的重要因素。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]货架寿命可以定义为从开始储存到SSOs 达到某一最大水平的时间。生产加工企业应进行货架期实验,以确定何时发生变质,并应有效验证致病性微生物生长趋势,使用合理科学研究来评估其食品的潜在风险。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]文献中有许多与温度相关的模型来描述微生物的生长还开发了一系列软件工具来预测食品中某些微生物的生长,然而只有少数是适用于实际的货架寿命预测。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]常见的微生物动力学一级模型主要包括四种,Linear 模型、Logistic模型、Gompertz 模型及Baranyi & Roberts 模型。其中Gompertz 模型是预测微生物学的基石,美国农业部开发的PMP(Pathogen Modeling Program)系统和英国农粮渔部开发的FM(Food Micromodel)系统都以Gompertz 函数作为初级模型。[/color][/size][/font] [font=宋体, SimSun][color=#007aaa][b][size=15px]3、感官预测保质期模型[/size][/b][/color][/font] [font=宋体, SimSun][size=15px][color=#48494d]感官预测保质期方法早在20 世纪80 和90 年代,Taoukis 等就描述了进行有效加速货架期测试(ASLT: Accelerated shelf-life testing)的原则和方法。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]在ASLT 方法中,温度是决定食品损伤的关键参数,因为温度越高,食品损伤越快。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]温度和变质速度之间的关系可以用阿伦尼乌斯方程来表示。通常有两类主要的测试可用于此目的:差异测试(特别是成对比较,双三联测试——通常在差异变化的控制测试中——和三角形测试)和使用适当尺度的测试(特征或某些特定属性)。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]目前国内外广泛使用的感官预测货架期方法为威布尔危险分析(Weibull hazard),这是一种较为实用的方法,有效地结合了ASLT 原理和感官方法并进行改进。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]威布尔概率函数在工程中被广泛用于描述失效现象,由Gacula 和Kubala提出用于货架寿命测试。该方法的原理主要为产品被消费者拒绝所体现的累计危害率与贮藏时间的关系式为:lgt=lgH/β+lgα[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]式中:t 为发现新变质食品的时间/d;[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]H 为累计危险率/%;[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]α 是尺度威布尔分布参数;[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]β 是形状威布尔分布参数。[/color][/size][/font] [font=宋体, SimSun][color=#007aaa][b][size=15px]4、保质期预测方法研究案例[/size][/b][/color][/font] [font=宋体, SimSun][size=15px][color=#48494d]Wahyuni等研究布朗尼蛋糕货架期的预测,采用加速货架期测试(ASLT)方法,并结合Arrhenius 模型。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]在该研究中,使用了20℃、30℃ 和40 ℃三种储存温度的变化,并选择硫代巴比妥酸(TBA)为变化指标进行监测。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]根据Ketaren的研究表明贮藏过程中脂肪等营养成分的变化会使食品发生酸败,氧化产物醛类可与TBA 生成有色化合物,用TBA 值来表示氧化程度,TBA 的数量是决定油脂损害程度的最重要因素。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]实验结果表明,TBA 的值随着贮藏温度的升高而增加,布朗尼的贮藏寿命通过阿伦尼乌斯方程来估计,即随着温度升高(20℃、30℃、40 ℃),产品货架期分别为1.57、4.9 和14 d。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]Nashi等对超高温瞬时处理后的燕麦谷物饮料进行风味特征的货架期研究,评价指标有不良风味混合物、正己醛和PVG,评价方法采用风味物质色谱分析法,并成立感官评价小组进行风味可接受程度打分,实验结果表明当正己醛含量高于初始值的3~5 倍时,燕麦谷物饮料风味为不可接受。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]HU 等研究壳聚糖包埋的鸡蛋在贮藏过程中品质变化和货架期,分别在5℃、20℃和35 ℃条件下,测定经包埋的鸡蛋在贮藏过程中品质的变化。并分析以哈夫值、密度和气室直径增加百分比的Pearson 相关系数,建立基于Arrhenius 方程的货架期预测模型。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]结果表明,随着贮藏时间的延长,鸡蛋品质呈下降趋势。高温(20℃和35 ℃)贮藏环境比低温(5 ℃)贮藏环境对品质劣化影响显著;蛋黄品质与霍夫单位的相关系数最高,可以作为预测货架期的重要指标;根据鸡蛋品质的变化规律,蛋黄因素可以建立一阶动力学模型。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]根据蛋黄品质变化数建立的模型,预测值与实测值拟合曲线的系数R2 为0.982 5,平均相对误差P 为9.32%,小于10%。较好地描述了蛋黄品质与温度之间的动力学关系。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]同时基于动态模型,确定了基于蛋黄系数的壳聚糖鸡蛋货架期预测模型。平均相对误差为7.6%,小于10%,说明基于蛋黄品质变化的鸡蛋货架期预测模型是可行的。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]刘红等研究表明目前我国食品及饮料行业保质期的测定大多依靠参照法,即经验值来进行确定,缺乏科学和标准测试方法。在我国应用较为广泛的为加速破坏性实验,所选用的方法为Q10 模型,主要研究贮藏期间温度对产品品质变化的影响。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]任亚妮等应用 ASLT 法预测软面包的货架期,实验温度选择为常温20℃、37℃ 和47 ℃,相对湿度为60%,通过检测37 ℃和47 ℃下产品的酸价、过氧化值和微生物指标(菌落总数、霉菌、大肠杆菌),并结合感官评价结果,结合Q10 模型,推算出常温贮藏条件下软面包的货架期。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]近年来,部分动力学模型和微生物生长模型也逐渐应用到我国产品保质期预测中。胡云峰等研究不同贮藏温度下鲜湿米粉的品质变化动力学模型,并应用Arrhenius 模型预测其货架期。研究结果表明鲜湿米粉的典蓝值的拟合系数较高,以典蓝值为预测目标建立的模型,经验证误差较小。[/color][/size][/font] [font=宋体, SimSun][size=15px][color=#48494d]程晓凤等研究压缩饼干货架期预测, 选择ASLT 方法结合Arrhenius 模型进行预测。在加速储藏温度条件下,测定压缩饼干酸价的变化,研究发现酸价变化较为明显,符合一级动力学模型,从而建立压缩饼干货架期预测方程,计算出产品在45 ℃下的保质期。[/color][/size][/font][/b][/b]

  • 模型传递方法

    [font=宋体]在[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]分析中,由于两台仪器之间存在差异,使得同一样品在两台仪器上所获得的光谱存在差别,导致一台仪器上所建立的模型不能用于另外一台仪器。仪器间的差异包括不同型号仪器之间的差异和相同型号仪器之间的差[/font][font=宋体]异。对于不同型号的仪器,由于分光原理或采用的检测器等不同,导致波长范围、波长精度及光谱响应会存在差异。对于相同型号的仪器,由于加工工艺水平局限及仪器随时间老化等原因,也会使仪器波长及光谱响应存在差异。在许多应用领域中,建立模型是一项烦琐、重复的工作,浪费人力、物力等资源,而且有些情况下样品可能不易获得或不易保存,存在重新建模困难,需要采用数学方法解决仪器之间的模型适用性问题,称之为模型传递。[/font][font=宋体][font=宋体]模型传递([/font][font=Times New Roman]Model transfer[/font][font=宋体]),也称仪器标准化([/font][font=Times New Roman]Standardization of spectrometric instruments[/font][font=宋体])是指经过数学处理后,使一台仪器上的模型(称为源机,[/font][font=Times New Roman]Master[/font][font=宋体])能够用于另一台仪器(称为目标机,[/font][font=Times New Roman]Slave[/font][font=宋体]),从而减少重新建模所带来的巨大工作量,实现样品和数据资源的共享。在确定仪器间光谱关系时,需要在两台仪器上同时测定某些样品的光谱,这些样品称为传递样品。根据是否需要传递样品,将模型传递分为无标样方法和有标样方法[/font][/font][sup][font=宋体][font=Times New Roman][6][/font][/font][/sup][font=宋体][font=宋体]。无标样方法在模型转移过程中不需要任何传递样品,主要以有限脉冲响应([/font][font=Times New Roman]Finite impulse response[/font][font=宋体],[/font][font=Times New Roman]FIR[/font][font=宋体])算法为代表。有标样方法必须选择一定数量的样品组成标样集,并在源机和目标机上分别测得其信号,从而找出该函数关系。这类算法又分为两种,一是基于预测结果的校正,如斜率[/font][font=Times New Roman]/[/font][font=宋体]偏差([/font][font=Times New Roman]Slope/Bias[/font][font=宋体])算法;二是基于仪器所测光谱信号的校正,如直接校正([/font][font=Times New Roman]Direct standardization[/font][font=宋体],[/font][font=Times New Roman]DS[/font][font=宋体])算法、分段直接校正[/font][/font][font=宋体][font=宋体]([/font][font=Times New Roman]Piecewise direct standardization[/font][font=宋体],[/font][font=Times New Roman]PDS[/font][font=宋体])算法和[/font][font=Times New Roman]Shenk[/font][font=宋体]’[/font][font=Times New Roman]s [/font][font=宋体]算法。此外,光谱空间转换([/font][font=Times New Roman]SST[/font][font=宋体])算法,已证明是一种效果良好的方法,其主要通过主从光谱空间之间的转换消除测量条件变化或仪器引起的光谱差异。[/font][/font]

  • 模型更新与维护

    [font=宋体][font=宋体]在模型的应用过程中,原料种植环境和工艺条件等的改变或调整都会导致模型不再适用,这时就需要进行模型的更新和维护。模型的更新过程需要收集多个有代表性的新样本,然后,按照常规建模流程添加到原模型校正集中,重新建立模型。如果进行了模型更新则需要重新进行验证过程。对模型更新验证集的要求与新建模型时相同,原有的验证集样本可以用于新模型的验证,但是,必须补充代表新范围或新类型的样本。读者可参考分子光谱多元校正定量分析通则[/font] [font=Times New Roman](GB/T[/font][/font][font='Times New Roman'] 29858[/font][font=宋体][font=Times New Roman]-[/font][/font][font='Times New Roman']2013[/font][font=宋体][font=Times New Roman])[/font][font=宋体]。[/font][/font]

  • 【分享】医学中的数学模型

    [size=3][font=宋体]一、医学数学化的发展历史[/font][/size][size=3][font=宋体] [/font][/size][size=3][font=宋体]数学应用于生命科学研究的历史可追溯到17 世纪。1615 年英国医生哈维(Farvey W)在研究心脏时应用流体力学知识和逻辑推理方法推断出血流循环系统的存在,18世纪欧拉利用积分方法计算了血流量问题,这些都是历史上应用数学研究生命科学的突出事例。但是,真正大范围地将数学应用于生命科学与医学研究则出现在20世纪中叶。1935年,Mottram对小白鼠皮肤癌的生长规律进行了研究,认为肿瘤细胞总数N随时间的变化速度与N成正比,并获得了瘤体在较短时间内符合指数生长规律的研究成果。1944 年奥地利著名物理学家薛定谔(Schrodinger E)出版了《生命是什么》(What is life)一书,应用量子力学和统计力学知识描述了生命物质的重要特征。在薛定谔的影响下,沃森(Watson JD)和克里克(Crick FHC)利用当时对蛋白质和核酸所做的射线结晶学研究以及其他与DNA结构有关的研究,于1953年建立了DNA超螺旋结构分子模型,验证了薛定谔的设想。在书中,薛定谔还利用非平衡热力学从宏观的角度解释生命现象,认为生命的基本特征是从环境中取得“负熵”,以使生物系统内的熵始终处于低水平。20多年后,普律高津(Prigogine I)等人提出耗散结构理论,将对生命系统的研究推广到薛定谔预言的领域,为此普律高津于1977年荣获了诺贝尔奖。作为医学领域的最高奖项,诺贝尔医学和生理学奖背后的许多数学影像也许更能说明数学在生命科学中的巨大潜力:英国生理学家、生物物理学家Hodgkin和Huxley建立了神经细胞膜产生动作电位时膜电位变化的模型,揭示了神经电生理的内在机制,因而于1963年共享诺贝尔奖;基于二维雷当变换(Radon transform)创建CT成像理论的美国科学家Cormack AM获得了1979年的诺贝尔奖,丹麦科学家Jerne NK则应用数学原理研究免疫网络理论获得1984年的诺贝尔奖。这些奖项有力地表明现代生命科学的研究离不开数学,数学在其中所起的作用和影响越来越重大,高层次的成果往往有赖于合理的数学模型的建立。[/font][/size][size=3][font=宋体] [/font][/size][size=3][font=宋体]数学不仅推动了人们探索生命世界的步伐,事实上两者结合已经产生了多个十分活跃的学科。1901年Peanson 创建生物统计学后,概率论与数理统计方法在医学上得到了非常广泛的应用,如目前常用的显著性检验、回归分析、方差分析、最大似然模型、决策树概率分布、微生物检测等,都属于基于统计学原理的数学模型及分析。1931年,Volterra在研究食物链的基础上,应用微分方程组研究生物动态平衡,完成了《生态竞争的数学原理》,开创了生物数学(biomathematics)这一新的分支。近年来,可视人及虚拟人的研究、计算医学(computational medicine/biology)、生物信息学(bioinformatics)、生理组学(Physiome)等新的学科及领域的出现,使数学这一工具在生物医学研究中的作用日益突出。[/font][/size][size=3][font=宋体] [/font][/size][size=3][font=宋体]生物系统是一个动态系统,作为世界上最复杂的系统之一,它具有调节机制复杂、多输入、多输出等特点,而且由于很多变量或参数很难在体测量及控制,仅仅通过实验研究来揭示其间的复杂关系,会非常困难且不易得到一致的结论。建立生物系统的数学模型,有利于获得生物系统的动态与定量变化,帮助阐明生物医学中有关作用机制等基础性问题,同时通过模型及仿真实验不仅可以得到正常状态,还可以获得异常或极端异常状态下的生理变化预测,以及代替一些技术复杂、代价高昂或难以控制和重现的实验,为临床或特定条件下的方案设计提供预测及指导。此外,从伦理学的角度,人们也希望医学研究中能够减少实验动物的数量,减轻临床试验中人体试验对象不必要的痛苦,因此生理系统的仿真与建模在生物医学领域中的研究中日益受到重视。目前,包括呼吸、血压、体温、各种调节系统等,都已建立了相应的数学模型,并进行了相应的模拟实验。针对特定应用的模型,如细胞动力学、药物动力学模型、生物种群生长模型、神经网络、心血管模型、临床计量诊断模型等,也不断呈现并得到应用。在本节下面的内容中,我们将以应用最为成功的模型之一,药物动力学模型为例,说明医用数学模型的建立过程。[/font][/size][size=3][font=宋体] [/font][/size][size=3][font=宋体]二、医用数学模型实例:药物动力学模型[/font][/size][size=3][font=宋体] [/font][/size][size=3][font=宋体]药物动力学(pharmacokinetics)是定量研究药物在生物体内吸收、分布、排泄和代谢等过程的动态变化规律的一门学科。于1937年由Teorell开创,主要内容是应用动力学原理、体外实验数据以及人体生理学知识,结合数学模型,定量研究药物在体内的运转规律,为药物的筛选提供指导。[/font][/size][size=3][font=宋体] [/font][/size][size=3][font=宋体]众所周知,新药研发过程费用昂贵、时间冗长、淘汰率高,大约有90%的候选药物在临床期间被淘汰,主要原因有口服吸收性差、生物利用度低、半衰期过短等等。为提高新药研究效率和安全性、降低药物研发成本,药物动力学模型已为全球各大制药公司应用。传统的新药研发流程中,药物动力学的应用主要在药物研发的中后期,近年来,人们开始在药物研发的早期对其药物动力学特性进行模拟研究,以尽早淘汰药物动力学参数不理想的候选药物,提高研发效率、降低成本。比如药物虚拟筛选(virtual screening)就是指在化合物合成前,先通过计算机模拟预测其药动学相关特性,进行初步筛选。此外,药物动力学模型在研究药物处置及作用机制、治疗药物监测及个体化用药、新药开发等方面也发挥着重要作用。[/font][/size][size=3][font=宋体] [/font][/size][size=3][font=宋体]药物动力学的数学模型包括房室模型、非线性药物动力学模型、生理药物动力学模型、药理药物动力学模型、统计矩模型等。下面以最常用的房室模型,结合前面所述的建模步骤,对药物动力学模型的建模过程进行分析描述。[/font][/size][size=3][font=宋体] [/font][/size][size=3][font=宋体](一)背景和问题表述[/font][/size][size=3][font=宋体] [/font][/size][size=3][font=宋体]药物进入机体后,在随血液输送到各个器官和组织的过程中,不断地被吸收、分布、代谢,最终被排出体外。药物在血液中的浓度,即单位体积血液中药物的含量,称为血药浓度。血药浓度的大小直接影响到药物的疗效。因此,药物动力学研究的主要对象是血药浓度随时间变化的规律——药时曲线,建模目的是建立能反映药物在体内分布的数学模型及参数,并能反映给药方式、给药时间间隔、给药剂量等对分布的影响。[/font][/size][size=3][font=宋体] [/font][/size][size=3][font=宋体](二)模型构建[/font][/size][size=3][font=宋体] [/font][/size][size=3][font=宋体]上述问题属于人体与外界以及人体内部的物质交换问题,研究这类问题最常用的是房室模型。药物动力学的房室分析方法将人的机体看做由不同房室构成的系统,每个房室代表药物在其中分布大致均匀的组织或体腔。如血液及供血丰富的肝、心、肾在特定情况下可视为一个房室,而血供不足的组织如肌肉、皮肤等可视为另一个房室。为了进行严格数学描述,常对模型做如下假设:①房室具有固定容量,且药物在每个房室内的分布是均匀的;②各房室间可进行物质交换,且至少有一个房室可与外环境进行交换;③房室间的物质交换或药物转移服从质量守恒定律,即系统中物质总量的改变等于输入总量与输出总量之差;④线性假设:药物的转移速率与药物浓度成正比。[/font][/size]

  • 【原创大赛】模型转移简介

    【原创大赛】模型转移简介

    [font='times new roman'][size=18px][b]模型转移[/b][/size][/font][font='times new roman'][size=18px][b]简介[/b][/size][/font][font='times new roman'][size=16px]模型转移可以定义为光谱数据或校准模型的数学转换,以便使所开发的方法与不同的仪器或不同的测量条件兼容。[/size][/font][font='times new roman'][size=16px]模型转移[/size][/font][font='times new roman'][size=16px]的目的是确保在不同情况下获得的[/size][/font][font='times new roman'][size=16px]模型[/size][/font][font='times new roman'][size=16px]结果的互换性,而不必对每种情况进行耗时的重新校准。化学计量[/size][/font][font='times new roman'][size=16px]学[/size][/font][font='times new roman'][size=16px]用于纠正仪器和环境的差异,如仪器反应功能的变化[/size][/font][font='times new roman'][size=16px]([/size][/font][font='times new roman'][size=16px]由仪器更换部分零件或设备老化[/size][/font][font='times new roman'][size=16px]引起)[/size][/font][font='times new roman'][size=16px]、样品的物理或化学组成[/size][/font][font='times new roman'][size=16px]的[/size][/font][font='times new roman'][size=16px]改变[/size][/font][font='times new roman'][size=16px]([/size][/font][font='times new roman'][size=16px]例如[/size][/font][font='times new roman'][size=16px]颗粒[/size][/font][font='times new roman'][size=16px]大小、表面结构、粘度等[/size][/font][font='times new roman'][size=16px])[/size][/font][font='times new roman'][size=16px]及测量条件的变化[/size][/font][font='times new roman'][size=16px]([/size][/font][font='times new roman'][size=16px]如温度和湿度的变化[/size][/font][font='times new roman'][size=16px])等。在本研究中,使用[/size][/font][font='times new roman'][size=16px]相[/size][/font][font='times new roman'][size=16px]同的仪器设备采集的在线与离线[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]被解释为测量条件的变化,[/size][/font][font='times new roman'][size=16px]样品以不同的方式呈现给光谱[/size][/font][font='times new roman'][size=16px]采集[/size][/font][font='times new roman'][size=16px]系统。[/size][/font][font='times new roman'][size=16px]此外,随着光谱采集时间的推移,即使同一样品的光谱也会出现漂移、波长转变、线性或非线性改变等变化,[/size][/font][font='times new roman'][size=16px]因此[/size][/font][font='times new roman'][size=16px]建立的校正集模型需要定期进行维护。如果这些变化不通过定期采集新的校正集光谱进行维护,建立的模型会出现不可估量的误差[/size][/font][font='times new roman'][size=16px],[/size][/font][font='times new roman'][size=16px]且在线模型较离线模型的收集需要消耗更多的物料,模型的定期维护需要更多的经济投入。为了提高在线模型的精度,节省成本,减少校正集光谱收集及模型维护带来的经济成本,采用化学计量学方法对离线光谱与在线光谱间模型传递进行研究,提高了模型的精度和稳定性。[/size][/font][font='times new roman'][size=16px]离线模型的建立验证了便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]用于流化床混合过程[/size][/font][font='times new roman'][size=16px]API[/size][/font][font='times new roman'][size=16px]含量监测的可行性。由于物料的动态特性及其他影响因素的干扰,在线模型精度较低。此外,随着光谱采集时间、环境等的推移,即使同一样品的光谱也会出现漂移、线性或非线性改变等变化,[/size][/font][font='times new roman'][size=16px]故建立[/size][/font][font='times new roman'][size=16px]的校正集模型需要定期进行维护。如果这些变化不通过定期采集新的校正集光谱进行维护,建立的模型会出现不可估量的误差,给生产和检验带来不可估量的损失,且在线模型较离线模型的收集需要消耗更多的物料,模型的定期维护需要更多的经济投入。为了提高在线模型的精度,节省成本,减少校正集光谱收集及模型维护带来的经济成本,[/size][/font][font='times new roman'][size=16px]针[/size][/font][font='times new roman'][size=16px]对流化床混合过程中建立的[/size][/font][font='times new roman'][size=16px]API[/size][/font][font='times new roman'][size=16px]含量[/size][/font][font='times new roman'][size=16px]定量分析模型,采用化学计量学方法对离线光谱与在线光谱间模型传递进行研究,提高了模型的精度和稳定性,将模型转移后建立的新模型用于中试生产过程[/size][/font][font='times new roman'][size=16px]API[/size][/font][font='times new roman'][size=16px]含量的在线监测,实现了实验室到中试应用的理论和实践研究。[/size][/font][font='times new roman'][size=16px]目前,模型转移方法主要包括两大类:光谱数据的模型传递法和结果校正的[/size][/font][font='times new roman'][size=16px]模型传递法[/size][/font][font='times new roman'][size=16px][color=#080000][73, 74][/color][/size][/font][font='times new roman'][size=16px]。其中光谱数据的模型传递包括光谱吸光度及波长(或波数)的校正两个方面。在诸多模型传递方法中,分段直接标准化法[/size][/font][font='times new roman'][size=16px](Piecewise direct standardization,[/size][/font][font='times new roman'][size=16px] [/size][/font][font='times new roman'][size=16px]PDS)[/size][/font][font='times new roman'][size=16px]是最常用的方法之一,也是常用的评价模型传递新方法的参比方法,在模型传递方法中占有重要地位。另一个常用的方法是分段反向标准化法[/size][/font][font='times new roman'][size=16px](Piecewise reverse standardization,[/size][/font][font='times new roman'][size=16px] [/size][/font][font='times new roman'][size=16px]PRS)[/size][/font][font='times new roman'][size=16px]。[/size][/font][font='times new roman'][size=16px]PDS[/size][/font][font='times new roman'][size=16px][color=#080000][75, 76][/color][/size][/font][font='times new roman'][size=16px]法和[/size][/font][font='times new roman'][size=16px]PRS[/size][/font][font='times new roman'][size=16px]法在原理相同的,但数据转换方向不同。[/size][/font][font='times new roman'][size=16px]PDS[/size][/font][font='times new roman'][size=16px]法是将辅仪器[/size][/font][font='times new roman'][size=16px](slave instrument)[/size][/font][font='times new roman'][size=16px]的光谱数据向主仪器方向转换或者将精度低的光谱数据向精度高的方向转换,[/size][/font][font='times new roman'][size=16px]PRS[/size][/font][font='times new roman'][size=16px]法相反,是将将精度高的光谱数据向精度低的方向转换。[/size][/font][font='times new roman'][size=16px]采用化学计量学方法对离线光谱和在线光谱间模型传递进行研究,提高了模型精度,节省了校正集收集及模型维护成本,实现了由实验室到工厂实际应用的理论和实践研究,具体计算过程如图所示,研究内容主要包括:[/size][/font][font='宋体'][size=16px]①[/size][/font][font='times new roman'][size=16px]流化床混合过程中,标准离线光谱[/size][/font][font='times new roman'][size=16px]([/size][/font][font='times new roman'][size=16px]Xstatic[/size][/font][font='times new roman'][size=16px])[/size][/font][font='times new roman'][size=16px]的收集和标准在线光谱[/size][/font][font='times new roman'][size=16px]([/size][/font][font='times new roman'][size=16px]Xdynamic[/size][/font][font='times new roman'][size=16px])[/size][/font][font='times new roman'][size=16px]的收集。[/size][/font][font='宋体'][size=16px]②[/size][/font][font='times new roman'][size=16px]通过标准离线光谱[/size][/font][font='times new roman'][size=16px]([/size][/font][font='times new roman'][size=16px]Xstatic[/size][/font][font='times new roman'][size=16px])[/size][/font][font='times new roman'][size=16px]和标准在线光谱[/size][/font][font='times new roman'][size=16px]([/size][/font][font='times new roman'][size=16px]Xdynamic[/size][/font][font='times new roman'][size=16px])[/size][/font][font='times new roman'][size=16px]建立转换矩阵[/size][/font][font='times new roman'][size=16px][b]F[/b][/size][/font][font='times new roman'][size=16px]。[/size][/font][font='宋体'][size=16px]③[/size][/font][font='times new roman'][size=16px]将采集到的校正集样品离线光谱[/size][/font][font='times new roman'][size=16px]X[/size][/font][font='times new roman'][size=16px]static[/size][/font][font='times new roman'][size=16px]([/size][/font][font='times new roman'][size=16px]cal[/size][/font][font='times new roman'][size=16px])[/size][/font][font='times new roman'][size=16px]通过转换矩阵得到新的校正集建模光谱[/size][/font][font='times new roman'][size=16px]X[/size][/font][font='times new roman'][size=16px]static[/size][/font][font='times new roman'][size=16px](fit)=[/size][/font][font='times new roman'][size=16px]Xstatic[/size][/font][font='times new roman'][size=16px]([/size][/font][font='times new roman'][size=16px]cal[/size][/font][font='times new roman'][size=16px]) [/size][/font][font='times new roman'][size=16px][b]F[/b][/size][/font][font='times new roman'][size=16px].[/size][/font][font='宋体'][size=16px]④[/size][/font][font='times new roman'][size=16px]将得到的校正集光谱矩阵[/size][/font][font='times new roman'][size=16px]X[/size][/font][font='times new roman'][size=16px]static[/size][/font][font='times new roman'][size=16px](fit)[/size][/font][font='times new roman'][size=16px]用于建立校正集模型,用于未知样品的预测。[/size][/font][font='宋体'][size=16px]⑤[/size][/font][font='times new roman'][size=16px]模型传递后与原在线模型及离线模型的比较。[/size][/font][font='宋体'][size=16px]⑥[/size][/font][font='times new roman'][size=16px]将模型转移后的模型用于中试流化床混合过程在线监测并对测量结果进行评价。[/size][/font][align=center][img]https://ng1.17img.cn/bbsfiles/images/2020/09/202009102207075705_1626_3890113_3.png[/img][/align][align=center][font='times new roman']模型转移计算流程图[/font][/align]

  • 近红外的模型转移

    我们知道在近红外的实际应用中,在某一近红外仪(称源机)上建立的校正模型,即便在另外一台与源机相同功能的近红外仪(称为目标机)上使用时,因各仪器测量的光谱有差异,模型不再适用,计算结果偏差很大或根本无法使用,解决这类问题的过程称为模型转移,也称为仪器标准化。众所周知建立近红外校正模型时往往需要测量大量样品的化学值或基础性质作为数据基础,投入大、成本高,因此使用模型转移技术实现模型共享和有效利用非常必要。模型转移可克服样品在不同仪器上的量测信号(或光谱) 间的不一致性,通过信号处理以消除仪器对量测信号的影响 ,不仅使已有模型具有较好的动态适应性,而且可以减少因重复建模造成的人力、物力、财力以及时间的浪费。大家在模型转移过程中遇到过什么问题,或有什么好的经验及建议,欢迎一起讨论。下面的四篇英文文献都是近红外模型转移的一些介绍

  • 模型传递、更新与维护

    [b][font=宋体]一、模型传递[/font][/b][font=宋体][url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]容易受外界因素干扰而发生扰动或者变化,例如温度、湿度、样本形态、仪器漂移或仪器更换等,导致建立的模型难以适应新的应用场景。通过建立不同条件下光谱、模型系数或预测结果的关系,从而消除预测偏差的方法称为模型转移[/font][sup][font=宋体][font=Times New Roman][[/font][/font][/sup][sup][font='Times New Roman']68][/font][/sup][font=宋体][font=宋体],常见的方法包括斜率截距法([/font][font=Times New Roman]Slope/bias,S/B[/font][font=宋体])、专利算法[/font][/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]Shenks [/font][/font][font='Times New Roman']a[/font][font=宋体][font=Times New Roman]lgorithm[/font][/font][font='Times New Roman'][font=宋体])[/font][/font][font=宋体]、直接标准化[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]Direct [/font][/font][font='Times New Roman']s[/font][font=宋体][font=Times New Roman]tandardization[/font][/font][font='Times New Roman'], [/font][font=宋体][font=Times New Roman]DS[/font][/font][font='Times New Roman'][font=宋体])[/font][/font][font=宋体]、分段直接标准化[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]Piecewise [/font][/font][font='Times New Roman']d[/font][font=宋体][font=Times New Roman]irect [/font][/font][font='Times New Roman']s[/font][font=宋体][font=Times New Roman]tandardization[/font][/font][font='Times New Roman'], [/font][font=宋体][font=Times New Roman]PDS[/font][/font][font='Times New Roman'][font=宋体])[/font][/font][font=宋体]、光谱空间转换[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]S[/font][/font][font='Times New Roman']pectral space transformation, SST[font=宋体])[/font][/font][font=宋体]、典型相关性分析[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]Canonical [/font][/font][font='Times New Roman']c[/font][font=宋体][font=Times New Roman]orrelation [/font][/font][font='Times New Roman']a[/font][font=宋体][font=Times New Roman]nalysis[/font][/font][font='Times New Roman'], [/font][font=宋体][font=Times New Roman]CCA[/font][/font][font='Times New Roman'][font=宋体])[/font][/font][font=宋体],交替三线性分解[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]Alternating tri-linear [/font][/font][font='Times New Roman']d[/font][font=宋体][font=Times New Roman]ecomposition[/font][/font][font='Times New Roman'], [/font][font=宋体][font=Times New Roman]ATLD[/font][/font][font='Times New Roman'][font=宋体])[/font][/font][font=宋体]光谱标准化和多级同时成分分析[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]M[/font][/font][font='Times New Roman']ulti-level simultaneous component analysis[/font][font=宋体][font=Times New Roman],MSCA[/font][/font][font='Times New Roman'][font=宋体])[/font][/font][sup][font='Times New Roman'][69][/font][/sup][font=宋体]。[/font][font=宋体]因子分析是将数据在低维空间中表示的一类方法,利用因子分析将高维空间中的光谱转移转化为低维空间中的抽象因子,这能够有效降低模型转移的复杂程度。例如,联合独立分块分析[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]J[/font][/font][font='Times New Roman']oint and unique multiblock analysis[font=宋体])[/font][/font][sup][font='Times New Roman'][70][/font][/sup][font=宋体]、域不变偏最小二乘[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]D[/font][/font][font='Times New Roman']omain-invariant partialleastsquares[font=宋体])[/font][/font][sup][font='Times New Roman'][71][/font][/sup][font='Times New Roman'][font=宋体]、[/font][/font][font=宋体]等仿射不变式[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]A[/font][/font][font='Times New Roman']ffine invariance[font=宋体])[/font][/font][sup][font='Times New Roman'][72][/font][/sup][font=宋体]等。张等[/font][sup][font='Times New Roman'][73][/font][/sup][font=宋体]在此基础上提出了一种基于权重系数的模型转移方法[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]C[/font][/font][font='Times New Roman']alibration transfer based on the weight matrix[font=宋体])[/font][/font][font=宋体],该方法在偏最小二乘权重系数的基础上构造模型转移函数,转化偏最小二乘权重为得分,将光谱间的转化关系变换为光谱与得分矩阵间的转化,简化了模型转移的复杂程度,提高了模型转移的可靠性。[/font][font=宋体]基于拉格朗日乘子法的正则化方法不但能够实现模型的平滑、稀疏等特性,还能够自由结合多种约束实现模型转移和模型更新。此类方法通过超参[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]Hyper-parameter[/font][/font][font='Times New Roman'][font=宋体])[/font][/font][font=宋体]来平衡效率[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体]目标函数[/font][font='Times New Roman'][font=宋体])[/font][/font][font=宋体]和模型复杂程度[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体]约束条件[/font][font='Times New Roman'][font=宋体])[/font][/font][font=宋体]的关系,但需要通过交互验证或者外部验证决定合适的参数。张等[/font][sup][font='Times New Roman'][74][/font][/sup][font=宋体][font=宋体]在此基础上提出了一种基于岭回归的模型更新方法,将预测优化目标和模型系数的[/font][font=Times New Roman]2[/font][font=宋体]范数约束结合起来,实现了模型系数的更新,解决了由于仪器漂移或样本变化引起的模型预测能力和可靠性变差的问题。[/font][/font][font=宋体]通常,使用标准样本的模型转移方法的结果相对更加准确,然而,其应用性受到限制。邵学广课题组提出了一系列无需标准样本的模型转移方法,例如,双模型策略[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]Dualmodelstrategy[/font][/font][font='Times New Roman'][font=宋体])[/font][/font][sup][font='Times New Roman'][75][/font][/sup][font=宋体]、偏最小二乘校正[/font][font='Times New Roman'][font=宋体]([/font]PLS-[/font][font=宋体][font=Times New Roman]c[/font][/font][font='Times New Roman']orrected[font=宋体])[/font][/font][sup][font='Times New Roman'][76][/font][/sup][font=宋体]和线性模型校正[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]L[/font][/font][font='Times New Roman']inear model correction, [/font][font=宋体][font=Times New Roman]LMC[/font][/font][font='Times New Roman'][font=宋体])[/font][/font][sup][font='Times New Roman'][77][/font][/sup][font=宋体]方法。这些算法不需要使用在不同仪器或者不同条件下采集的标准样本的[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url],因此,可以用于无标准光谱的模型维护和增强。张等[/font][sup][font='Times New Roman'][78][/font][/sup][font=宋体][font=宋体]在[/font][font=Times New Roman]LMC[/font][font=宋体]基础上提出的修正线性模型校正[/font][/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]M[/font][/font][font='Times New Roman']odified linear model correction[/font][font=宋体][font=Times New Roman],[/font][/font][font='Times New Roman']m[/font][font=宋体][font=Times New Roman]LMC[/font][/font][font='Times New Roman'][font=宋体])[/font][/font][font=宋体]方法利用拉格朗日乘子法,将预测优化目标函数与不同条件下模型系数相关性约束相结合,实现了对不同仪器设备基础上建立的分析模型高效、快速的无标准样本转移。此外,张等[/font][sup][font='Times New Roman'][79][/font][/sup][font=宋体][font=宋体]提出了利用相关系数约束结合全局游湖算法实现了无参数的模型增强([/font][font=Times New Roman]P[/font][/font][font='Times New Roman']arameter-free calibration enhancement[font=宋体])[/font][/font][font=宋体]框架,包括无监督、半监督和全监督的模型转移、维护和增强等多种应用情况。[/font][font=宋体][font=宋体]以上所介绍的这些方法,又称为[/font][font=宋体]“软拷贝”转移模型,值得近红外用户关注的是,随着仪器制造技术的不断提高,近红外仪器之间的光学性能差异越来越小,仪器之间的光谱测量结果具有很好的重现性,将原机模型或光谱“硬拷贝”到新光谱仪上就能正常使用,省去了复杂的“软拷贝”计算工作。[/font][/font]

  • 不同种类的汽油样品是否可以建在一个模型中?

    [font=宋体]这个问题在炼化企业应用中经常会被问及,因为校正样品收集比较困难,累积到足够数量和范围需要比较长的时间,而炼厂需要测定来源于不同工艺的各种汽油样品,需要建立多个模型。如果不同种类的汽油样品建立一个模型,则可以同时满足校正集关于数量和范围的要求。但是很遗憾,不同种类的汽油往往不能建立在一个模型中,主要原因是:[/font][font=宋体][font=宋体]([/font][font=Times New Roman]1[/font][font=宋体])不同种类的汽油组成差异很大,样品光谱在光谱空间中形成分类聚集,无法满足校正样品均匀分布的要求。[/font][/font][font=宋体][font=宋体]([/font][font=Times New Roman]2[/font][font=宋体])部分性质,如辛烷值,与光谱存在复杂的非线性关系,很难在宽范围内建立模型,同时又满足测量准确性要求。[/font][/font]

  • 在线分析校正模型是如何建立的?

    [font=宋体][font=宋体]在线分析校正模型的建立主要分为[/font][font=Times New Roman]5[/font][font=宋体]个步骤:[/font][/font][font=宋体][font=宋体]([/font][font=Times New Roman]1[/font][font=宋体])获取代表性样品并采集对应的[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]。校正模型预测性能的稳健性很大程度上取决于样品本身的代表性,因此获取有良好代表性的样品是建模过程中及其关键的一环。待获取样品后,利用光谱采集装置进行在线[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]的采集,然后利用标准方法测定各份样品待测指标的数值,最后获得样品待测指标与对应光谱信息一一对应的数据集。[/font][/font][font=宋体][font=宋体]([/font][font=Times New Roman]2[/font][font=宋体])校正样本集与验证样品集的选择。校正样本集用来模型训练而验证样本集则用来验证模型的预测性能。理想的校正集应包含未来待测样本中可能存在的所有化学成分,其浓度范围应大于待测样本。目前,常利用[/font][font=Times New Roman]Kennard[/font][/font][font='Times New Roman']-Stone[/font][font=宋体]法、光谱[/font][font='Times New Roman']-[/font][font=宋体]理化值共生距离法进行校正集和验证集的选取。[/font][font=宋体][font=宋体]([/font][font=Times New Roman]3[/font][font=宋体])光谱预处理及波长筛选。在建模过程中,光谱预处理往往是必不可少的,运用适当的方法进行预处理可以有效保留光谱中的关键信息并剔除噪声信息,以提升校正模型的预测性能。波长选择也是重要环节之一,进行波长筛选一方面可以简化模型,更主要的是由于不相关或非线性变量的剔除,可以得到预测能力强、稳健性好的模型。[/font][/font][font=宋体][font=宋体]([/font][font=Times New Roman]4[/font][font=宋体])异常样本的剔除。异常样本会极大的影响建模过程,降低模型的预测准确性和稳定性,因此需要异常样本的识别与剔除。[/font][/font][font=宋体][font=宋体]([/font][font=Times New Roman]5[/font][font=宋体])校正模型的建立。待前面[/font][font=Times New Roman]4[/font][font=宋体]个部分的工作完成后,借助化学计量学算法建立定量校正模型,运用校正标准误差、预测标准误差、决定系数或相关系数等对校正模型的预测性能进行评价。涉及建立、评价定量校正模型或定性判别模型(类模型)可参考[/font][/font][font='Times New Roman']ASTM E-1655[/font][font=宋体]、[/font][font='Times New Roman']GB/T29858-2013[/font][font=宋体]和[/font][font='Times New Roman']GB/T37969-2019[/font][font=宋体]等[/font][font='Times New Roman'][font=宋体]标准[/font][/font][font=宋体]。[/font][font='Times New Roman'][font=宋体]此外,在线模型也可由实验室建立的离线模型通过模型传递技术获得。[/font][/font]

  • 异常值识别与模型优化方法

    [font=宋体][font=宋体]异常样品对模型的稳健性会产生严重的干扰,在建模过程中需要进行剔除。异常样品一般分为两大类,第一类是高杠杆值样品,其光谱远离整体样品的平均光谱;第二类是预测值与参考值具有显著差异的样品,由参考值测量误差大、光谱测量误差大、参考值录入错误及模型不适用等原因造成。对于定量分析,一般可以采用马氏距离和杠杆值剔除第一类异常样品,利用学生化残差剔除第二类异常样品。对于定性分析,常采用[/font][font=Times New Roman]Hotelling[/font][/font][font='Times New Roman']’[/font][font=宋体][font=Times New Roman]s [/font][/font][i][font=宋体][font=Times New Roman]T[/font][/font][sup][font=宋体][font=Times New Roman]2[/font][/font][/sup][/i][font=宋体]检验或[/font][i][font=宋体][font=Times New Roman]F[/font][/font][/i][font=宋体]检验进行异常样品(光谱)的剔除。[/font][font=宋体][font=宋体]在剔除异常样品后,需要对模型进行优化,即选择合适的主成分或变量数建立模型。若所用的主成分或变量数过少,则可能未能充分利用信息,模型会欠拟合,导致模型预测精度下降;而主成分或变量数过多,则可能引入噪声,导致模型过拟合,使得模型稳定性变差。在实际建模中,一般采用交互验证方法进行模型优化,并根据交互验证误差([/font][font=Times New Roman]SECV[/font][font=宋体]或[/font][font=Times New Roman]RMSECV[/font][font=宋体])或预测残差平方和([/font][font=Times New Roman]PRESS[/font][font=宋体])最小来确定适宜的主成分或变量数。[/font][/font][font=宋体][font=宋体]在模型优化后,需要采用验证集样品对模型的有效性进行验证。验证集样品的选取一般要符合一定的要求。对于定量分析,一般采用验证标准误差([/font][font=Times New Roman]SEV[/font][font=宋体])对校正模型有效性进行验证。对于定性分析,通常采用判别正确率对类模型的有效性进行验证。[/font][/font][font=宋体]具体的异常值识别、模型优化与有效性验证方法及验证样品选取标准参见国家标准[/font][font='Times New Roman']GB/T 29858[/font][font=宋体][font=Times New Roman]-2013[/font][font=宋体]和[/font][/font][font='Times New Roman']GB/T37969[/font][font=宋体][font=Times New Roman]-2019[/font][font=宋体]。[/font][/font]

  • 【求助】模型转移的问题

    现在使用最广的模型转移算法是所谓的pair matching方法,我的问题是怎么保证那个光谱或者说光谱所测量的体系在校正转移前后是绝对一样的,而不受温度,湿度等等的影响。换句话说,在模型转移的过程中怎么提供一个绝对不变的被测体系呢?

  • 如何建立数学模型(转载)

    如何建立数学模型(转载)

    如何建立数学模型讲授人:中国计量科学研究院研究员 倪育才 在测量不确定度评定中,建立数学模型也称为测量模型化,目的是要建立满足测量不确定度评定所要求的数学模型,即建立被测量Y和所有各影响量X间的函数关系,其一般形式可写为: Y=f(X1,X2,…,Xn) 可以说,建立数学模型是进行测量不确定度评定最关键的第一步,也是许多初学者在进行测量不确定度评定时遇到的第一个困难。 《测量不确定度表示指南》(GUM)在摘要介绍测量不确定度评定步骤时,首先就提到要建立数学模型,并说:“The function f should contain everyquantity, including all corrections and correction factors, that can contributea significant component of uncertainty to the result of measurement. ”。其意是数学模型f中应包含所有对测量结果的不确定度有影响的修正值和修正因子。也就是说,数学模型中应包含所有应该考虑的影响量,而每一个影响量将对测量结果贡献一个值得考虑的不确定度分量。因此一个好的数学模型,其中所包含的影响量和此后不确定度评定中所考虑的每一个不确定度分量应该是一一对应的。这样建立起来的数学模型,既能用来计算测量结果,又能用来全面地评定测量结果的不确定度。 要找出每一个影响量与被测量之间的函数关系,往往是很困难的,有时简直不可能得到两者关系的解析表达式。于是许多初学者往往将测量中用来获得被测量的计算公式作为数学模型而列出。例如在各种测量中,最经常采用的方法之一是比较测量。将被测量值y和参考标准所提供的标准量值s相比较,通过测量两者之差Δ可以计算出被测量y。于是在已经发表的各种测量不确定度评定的文章中,经常见到将y=x+Δ作为数学模型的情况。但在进行不确定度评定时,则又往往脱离数学模型而重新考虑各个不确定度分量。这样的数学模型对测量不确定度评定实际上毫无帮助。 在某些特殊情况下(例如某些检测项目)将计算公式作为数学模型可能是允许的,但一般说来不要把数学模型简单地理解为就是计算测量结果的公式,也不要理解为就是测量的基本原理公式。两者之间经常是有区别的。 从原则上说,似乎所有对测量结果有影响的输入量都应该在计算公式中出现,但实际情况却不然。有些输入量虽然对测量结果有影响,但由于信息量的缺乏,在具体测量时无法定量地计算它们对测量结果的影响。也有些输入量由于对测量结果的影响很小而被忽略,故在测量结果的计算公式中也不出现,但它们对测量结果的不确定度的影响却可能是必须考虑的。因此如果仅从计算公式出发来进行不确定度评定,则上述这些不确定度分量就可能被遗漏。当然,在某些特殊情况下如果所有其他不确定度贡献因素的影响都可以忽略不计时,数学模型也可能与计算公式相同。 对于不同的被测量和不同的测量方法,数学模型的具体形式可能差别很大,但实际上都可以用一种比较系统的方式来给出数学模型,或者说可以给出数学模型的通式。 根据测量误差的定义:误差=测量结果-真值。同时误差又可以分为随机误差和系统误差两类,且三者之间的关系为:误差=系统误差+随机误差。于是可以得到: 真值=测量结果-误差   =测量结果-系统误差-随机误差 由于修正值等于负的误差,于是上面的关系式就成为: 真值=测量结果-系统误差-随机误差   =测量结果+系统误差的修正值+随机误差的修正值 实际上,真值就是想得到的被测量的测量结果,于是上式可写成 被测量=测量结果+系统误差的修正值+随机误差的修正值 例1:对于常见的量块比较测量,若ls为标准量块的长度,Δl为测得的两量块的长度差,于是被测量块长度lx的计算公式为: lx=ls+Δl 由于测量时量块的温度通常会偏离标准参考温度20℃,考虑到温度和线膨胀系数对测量结果的影响,计算公式成为: lx=ls+Δl+lsδαθx+lsαsδθ 式中α和θ分别表示线膨胀系数和对标准参考温度20℃的偏差;脚标“s”、“x”分别表示标准量块和被测量块;以及δθ=θs-θx和δα=αs-αx。 考虑到量块测量点可能偏离量块测量面中心点对测量结果的影响,数学模型成为: lx=ls+Δl+lsδαθx+lsαsδθ+δl 将此数学模型和上面给出的通式相比较就可以发现,等式右边的第一、二项ls+Δl即是由测量得到的未修正的测量结果。等式右边的第三、四项lsδαθx+lsαsδθ是对由温度偏差所引入的系统误差的修正值,在本例中这两项的数值十分小而可以忽略,但它们对测量结果不确定度的影响是必须考虑的。等式右边的最后一项δl,是表示由于测量点可能偏离量块中心对测量结果的影响。测量点的偏离对测量结果引入随机误差,因此最后一项实际上是对该随机误差的修正值。由下图可见两者之间的对应关系。http://ng1.17img.cn/bbsfiles/images/2013/10/201310181455_471725_2771427_3.jpg 例2:砝码校准,将被测砝码的质量与具有相同标称值的标准砝码相比较。若被校准砝码和标准砝码的折算质量分别为mx和ms,测得两者的质量差为Δm,于是被校准砝码折算质量mx的计算公式为: mx=ms+Δm 考虑到标准砝码的质量自最近一次校准以来可能产生的漂移Δmd,质量比较仪的偏心度和磁效应的影响Δmc,以及空气浮力对测量结果的影响δB后,其数学模型成为: mx=ms+Δm+δmd+δmc+δB 模型中等式右边的第一、二项为未修正的测量结果。该测量不存在值得考虑的系统误差,也就是说,在数学模型中不存在对系统误差的修正值。等式右边的第三、四、五项为对三项随机误差分量的修正量。与数学模型通式之间的对应关系为:http://ng1.17img.cn/bbsfiles/images/2013/10/201310181455_471726_2771427_3.jpg 在建立数学模型时,未修正的测量结果和系统误差的修正值通常都能比较容易地得到解析形式的数学表达式。惟有随机误差的修正值无法得到其解析形式的表达式。因此只能在数学模型中简单地加上一项,表示对随机误差的修正值。根据随机误差的定义,无限多次测量结果的随机误差的平均值等于零,因此这些项的数学期望为零。也就是说,增加这些修正值后不会对被测量的数值有影响。需要知道的是这些修正值的可能取值范围,通常可以由测量者的经验或

  • 【资料】生物多样性模型研究

    提 要 通过 1949 年以来在各种出版物上已发表的 27 种生物多样性模型分析发现,大多数多样性模型在理论上是不完善的。例如,被应用最广泛的 Shannon 模型至少有 4 个缺点:①没有考虑物种间生物量的区别;②如果要使用 Shannon 模型,每种物种的个数或每种景观单元的个数不能小于 100;③模型中没有隐含面积参数;④不能够表达多样性的丰富性方面。因此,作者推举了一种理论上完善的综合生物多样性模型,并为了满足实际操作和生物多样性自相似性研究的需要,对其中的一些参数进行了修正。关键词 多样性;丰富性;均一性;理论模型[img]http://www.instrument.com.cn/bbs/images/affix.gif[/img][url=http://www.instrument.com.cn/bbs/download.asp?ID=103383]生物多样性模型研究[/url]

  • 卷积神经网络模型发展及应用

    卷积神经网络模型发展及应用

    [b]卷积神经网络模型发展及应用转载地址:[/b]http://fcst.ceaj.org/CN/abstract/abstract2521.shtml [img]https://oss-emcsprod-public.modb.pro/image/editor/20220802-9243a15c-bcd6-4a63-921e-932f257a1e05.png[/img][img=,690,212]https://ng1.17img.cn/bbsfiles/images/2022/08/202208021122351500_3641_5785239_3.png!w690x212.jpg[/img]深度学习是机器学习和人工智能研究的最新趋势,作为一个十余年来快速发展的崭新领域,越来越受到研究者的关注。卷积神经网络(CNN)模型是深度学习模型中最重要的一种经典结构,其性能在近年来深度学习任务上逐步提高。由于可以自动学习样本数据的特征表示,卷积神经网络已经广泛应用于图像分类、目标检测、语义分割以及自然语言处理等领域。[b]首先分析了典型卷积神经网络模型为提高其性能增加网络深度以及宽度的模型结构,分析了采用注意力机制进一步提升模型性能的网络结构,然后归纳分析了目前的特殊模型结构,最后总结并讨论了卷积神经网络在相关领域的应用,并对未来的研究方向进行展望。[/b]卷积神经网络(convolutional neural network,CNN) 在计算机视觉[1- 5]、自然语言处理[6- 7]等领域已被广泛 应用。在卷积神经网络兴起之前,主要依靠人工针对特定的问题设计算法,比如采用 Sobel、LoG(Laplacian of Gaussian)、Canny、Prewitt 等[8- 11]算子进行边 缘 检 测 ,采 用 Harris、DoG(difference of Gaussian)、FAST(features from accelerated segment test)、SIFT (scale invariant feature transform)等[12-15]用于角点等特 征检测,并且采用传统分类器如 K近域、支持向量机、 稀疏分类器等[16- 18]进行分类。特征提取和分类器的 设计是图片分类等任务的关键,对分类结果的好坏 有着最为直接的影响。卷积神经网络可以自动地从 训练样本中学习特征并且分类,解决了人工特征设计 的局限性。神经网络的思想起源于1943年McCulloch 和 Pitts 提出的神经元模型[19],简称 MCP 神经元模 型。它是利用计算机来模拟人的神经元反应的过 程,具有开创性意义。此模型将神经元反应简化为 三个过程:输入信号线性加权、求和、非线性激活。1958 年到 1969 年为神经网络模型发展的第一阶段, 称为第一代神经网络模型。在 1958 年 Rosenblatt 第 一次在 MCP 模型上增加学习功能并应用于机器学 习,发明了感知器算法[20],该算法使用 MCP 模型能够 采用梯度下降法从训练样本中自动学习并更新权 值,并能对输入的多维数据进行二分类,其理论与实 践的效果引起了神经网络研究的第一次浪潮。1969 年美国数学家及人工智能先驱 Minsky在其著作中证 明感知器本质上是一种线性模型[21],只能处理线性分 类问题,最简单的异或问题都无法正确分类,因此神 经网络的研究也陷入了近二十年的停滞。1986 年到 1988 年是神经网络模型发展的第二阶段,称为第二 代神经网络模型。1986 年 Rumelhart 等人提出了误 差反向传播算法(back propagation algorithm,BP)[22]。BP 算法采用 Sigmoid 进行非线性映射,有效解决了 非线性分类和学习的问题,掀起了神经网络第二次 研究高潮。BP 网络是迄今为止最常用的神经网络, 目前大多神经网络模型都是采用 BP网络或者其变化 形式。早期神经网络缺少严格数学理论的支撑,并 且在此后的近十年时间,由于其容易过拟合以及训 练速度慢,并且在 1991 年反向传播算法被指出在后 向传播的过程中存在梯度消失的问题[23],神经网络再 次慢慢淡出人们的视线。1998 年 LeCun 发明了 LeNet-5,并在 Mnist 数据 集达到 98%以上的识别准确率,形成影响深远的卷积 神经网络结构,但此时神经网络的发展正处于下坡 时期,没有引起足够的重视。从感知机提出到 2006 年以前,此阶段称为浅层 学习,2006 年至今是神经网络的第三阶段,称为深度 学习。深度学习分为快速发展期(2006—2012 年)和 爆发期(2012 年至今),2006 年 Hinton 提出无监督的 “逐层初始化”策略以降低训练难度,并提出具有多 隐层的深度信念网络(deep belief network,DBN)[24], 从此拉开了深度学习大幕。随着深度学习理论的研究和发展,研究人员提 出了一系列卷积神经网络模型。为了比较不同模型 的质量,收集并整理了文献中模型在分类任务上的 识别率,如图 1所示。由于部分模型并未在 ImageNet 数据集测试识别率,给出了其在 Cifar-100 或 Mnist数 据集上的识别率。其中,Top-1识别率指的是 CNN 模型预测出最大概率的分类为正确类别的概率。Top-5 识别率指的是 CNN 模型预测出最大概率的前 5 个分 类里有正确类别的概率。2012 年,由 Alex Krizhevshy 提出的 AlexNet给卷 积神经网络迎来了历史性的突破。AlexNet 在百万 量级的 ImageNet数据集上对于图像分类的精度大幅 度超过传统方法,一举摘下了视觉领域竞赛 ILSVRC2012的桂冠。自 AlexNet之后,研究者从卷积神经网 络的结构出发进行创新,主要有简单的堆叠结构模 型,比如 ZFNet、VGGNet、MSRNet。堆叠结构模型通 过改进卷积神经的基本单元并将其堆叠以增加网络 的深度提升模型性能,但仅在深度这单一维度提升 模 型 性 能 具 有 瓶 颈 ;后 来 在 NIN(network in network)模型提出使用多个分支进行计算的网中网结 构模型,使宽度和深度都可增加,具有代表性的模型 有 Inception 系列模型等;随着模型深度以及宽度的 增加,网络模型出现参数量过多、过拟合以及难以训 练等诸多问题。ResNet 提出残差结构后,为更深层 网络构建提出解决方案,随即涌现出很多残差结构模 型,比如基于 ResNet 改进后的 ResNeXt、DenseNet、 PolyNet、WideResNet,并且 Inception也引入残差结构 形成了 Inception-ResNet-block,以及基于残差结构并 改进其特征通道数量增加方式的 DPResNet;与之前 在空间维度上提升模型性能的方法相比,注意力机 制模型通过通道注意力和空间注意力机制可以根据 特征通道重要程度进一步提升模型性能,典型的模 型为 SENet、SKNet 以及 CBAM(convolutional block attention module)。传统的卷积神经网络模型性能十分优秀,已经 应用到各个领域,具有举足轻重的地位。由于卷积 神经网络的模型十分丰富,有些模型的结构或用途 比较特殊,在本文中统称为特殊模型,包括具有简单的结构和很少参数量的挤压网络模型 SqueezeNet,采 用无监督学习的生成对抗网络模型(generative adversarial network,GAN),其具有完全相同的两路网络 结构以及权值的孪生神经网络模型 SiameseNet,以 及通过线性运算生成其他冗余特征图的幽灵网络 GhostNet。由于卷积神经网络的一系列突破性研究成果, 并根据不同的任务需求不断改进,使其在目标检测、 语义分割、自然语言处理等不同的任务中均获得了 成功的应用。[b]基于以上认识,本文首先概括性地介绍了卷积 神经网络的发展历史,然后分析了典型的卷积神经 网络模型通过堆叠结构、网中网结构、残差结构以及 注意力机制提升模型性能的方法,并进一步介绍了 特殊的卷积神经网络模型及其结构,最后讨论了卷 积神经网络在目标检测、语义分割以及自然语言处 理领域的典型应用,并对当前深度卷积神经网络存 在的问题以及未来发展方向进行探讨。[img=,690,387]https://ng1.17img.cn/bbsfiles/images/2022/08/202208021123119824_325_5785239_3.png!w690x387.jpg[/img][/b][img]https://oss-emcsprod-public.modb.pro/image/editor/20220802-51d3c121-d787-4a08-a7a4-a7f9ecb3a33d.png[/img][b]转载文章,如有侵权,请联系我删除[/b]

  • 【求助】定量模型的建立遇见的问题

    各位前辈,我是菜鸟,问的问题可能有点弱智,我想咨询一下建立定量模型的问题,在建立定量模型的时候,因样本较少(50多份),我用校正集建立模型,在参数检验的时候,用的是交叉检验,在曲线下面,如果选用Validation检验,R2较小,RMSECV较大,我应该怎样调整我的模型呢,我还想想问一下怎么评价一个模型的好坏,谢谢!

  • 中药成分复杂,模型是否能通用?是不是都需要建立不同的模型?

    [font='Times New Roman'][font=宋体]同一品种不同厂家生产的药品不需要重新建模,[/font][/font][font=宋体]但要注意模型的验证与更新、转移。[/font][font='Times New Roman'][font=宋体]针对中药材大品种建立的模型可以通用,比如[/font][/font][font=宋体]黄芩[/font][font='Times New Roman'][font=宋体]、[/font][/font][font=宋体]金银花[/font][font='Times New Roman'][font=宋体]、[/font][/font][font=宋体]丹参[/font][font='Times New Roman'][font=宋体]等。但[/font][/font][font=宋体]对于[/font][font='Times New Roman'][font=宋体]大多数[/font][/font][font=宋体]中药[/font][font='Times New Roman'][font=宋体]复方制剂,[/font][/font][font=宋体]成分非常复杂,[/font][font='Times New Roman'][font=宋体]不同厂家[/font][/font][font=宋体]所用原料及工艺也存在一定的区别,[/font][font='Times New Roman'][font=宋体]建立的模型不能通用,需要重新取样建模。[/font][/font][font=宋体][font=宋体]为了保证所建模型的预测能力,往往采用[/font][font=宋体]“一品一模”、“一厂一模”等做法。[/font][/font]

  • 【讨论】一组同样的数据做模型,为啥模型不一样?

    用同样的数据,同样的数学处理得到的模型为什么不一样?今天我用一组数据做一个模型,然后把这组数据按一成分含量高低排序,重新做模型,做模型的数学处理方法也是一样的。但是为什么模型不一样呢?两个模型预测另外一组数据,预测结果有的差的还很大? 这是什么原因呢? 大虾们有知道的吗? http://simg.instrument.com.cn/bbs/images/brow/em09501.gif

  • 基于多模型加权预测的近红外定量分析方法

    基于多模型加权预测的近红外定量分析方法

    [b][size=18px][font=宋体]1[/font][font=宋体]、背景介绍[/font][/size][/b][font=宋体] 随着微机电技术的发展,近几年,便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]被广泛应用于食品、饮料、医药、煤炭等各个领域,相较于传统的大型傅里叶变换光谱分析系统,其具有结构简单、成本低廉、携带方便、结果实时可见等优势,目前已成为光谱领域的热门产品。但是便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]易受光源、检测器、使用方法、环境条件等影响,使得采集的光谱数据稳定性差,精度低,进而造成预测结果不稳定、预测准确率低等问题。[/font][font=宋体] 为了解决上述问题,提升便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]分析结果的稳定性及准确性,目前行业内[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]数据建模优化工作,主要集中于数据源筛选、预处理算法优化、模型筛选算法优化等基于PLS算法的单模型建模优化工作,此类建模算法主要适用于高精度的傅里叶[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]。对于自身硬件分辨率较低的便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url],适用性较差。因此本帖在基于PLS算法建模的基础上,提出多模型加权预测的方法,以特定准则选取相对稳定、准确率较高的若干个光谱模型,结合模型自身系数进行加权预测的方式来提升便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]整体性能,进而提升便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]的预测稳定性及准确率。[/font][b][size=18px][font=宋体]2[/font][font=宋体]、方法解析[/font][/size][font=宋体]2.1[/font][font=宋体]样本集合划分[/font][/b][font=宋体] 使用便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]采集400个待测样品,采用Kennard Stone(K-S)算法对样本进行划分,将样本划分为训练集(200个)、验证集(100个)、盲测集(100个)、避免人为划分样本的主观性。[/font][b][font=宋体]2.2[/font][font=宋体]光谱预处理[/font][/b][font=宋体] 便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]采用常规的单一预处理方式效果不佳,本贴采用双预处理嵌套的方式对样品进行处理,其中第一级、第二级预处理均可设置不同的预处理参数,通过不同预处理方式,预处理参数的设置可以获取多种预处理结果。[/font][align=center][img=双预处理嵌套,690,325]https://ng1.17img.cn/bbsfiles/images/2023/09/202309042103332831_7122_5075516_3.png!w690x325.jpg[/img][/align][b][font=宋体]2.3[/font][font=宋体]光谱建模[/font][/b][font=宋体] [url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]定量分析建模方法包括多元线性回归([/font][font='Times New Roman',serif]MLR[/font][font=宋体])、主成分回归([/font][font='Times New Roman',serif][url=https://insevent.instrument.com.cn/t/jp][color=#3333ff]PCR[/color][/url][/font][font=宋体])、偏最小二乘回归([/font][font='Times New Roman',serif]PLS[/font][font=宋体])、人工神经网络([/font][font='Times New Roman',serif]ANN[/font][font=宋体])和支持向量机([/font][font='Times New Roman',serif]SVM[/font][font=宋体])等。其中,[/font][font='Times New Roman',serif]PLS[/font][font=宋体]算法应用最为广泛,选用[/font][font='Times New Roman',serif]PLS[/font][font=宋体]算法进行建模。通过多种预处理结果、不同[/font][font='Times New Roman',serif]PLS[/font][font=宋体]主成分数选择组合建立多个光谱定量分析模型,若设定一级预处理为[/font][font='Times New Roman',serif]M[/font][font=宋体]种,二级预处理为[/font][font='Times New Roman',serif]N[/font][font=宋体]种,[/font][font='Times New Roman',serif]PLS[/font][font=宋体]主成分数选择为[/font][font='Times New Roman',serif]T[/font][font=宋体]种,则通过不同排列组合可以建立合计[/font][font='Times New Roman',serif]M*N*T[/font][font=宋体]个光谱定量分析模型。[/font][align=center][img=多种建模方式,690,198]https://ng1.17img.cn/bbsfiles/images/2023/09/202309042104079253_7276_5075516_3.png!w690x198.jpg[/img][/align][b][font=宋体]2.4[/font][font=宋体]光谱模型选择[/font][/b][font=宋体] 基础模型一:在上述建立的大量光谱定量分析模型中,选择光谱模型最通用的两大表征系数,即模型相关系数([/font][font='Times New Roman',serif]R2[/font][font=宋体]值)以及均方根误差([/font][font='Times New Roman',serif]RMSECV[/font][font=宋体]值)进行基础模型筛选,选择模型相关系数最大的模型为基础模型[/font][font='Times New Roman',serif]A[/font][font=宋体],模型均方根误差最小的模型为基础模型[/font][font='Times New Roman',serif]B。[/font][font=宋体] 基础模型二:在基础模型一中引入验证集,通过训练集建立的多个光谱模型对验证集进行预测,将预测值与验证集标定值进行计算,获取偏差值,选择偏差值最小的光谱模型为基础模型[/font][font='Times New Roman',serif]C。[/font][align=center][img=基础模型C,690,264]https://ng1.17img.cn/bbsfiles/images/2023/09/202309042104332526_3725_5075516_3.png!w690x264.jpg[/img][/align][font=宋体] 基础模型三:在基础模型二中引入准确率,在近红外快检的实际应用中,对于预测偏差值在一定阈值范围内的样本定义为准确预测样本,若超出阈值则为预测错误样本,选择准确率最高的光谱模型为基础模型[/font][font='Times New Roman',serif]D。[/font][align=center][img=基础模型D,690,235]https://ng1.17img.cn/bbsfiles/images/2023/09/202309042104460652_3475_5075516_3.png!w690x235.jpg[/img][/align][b][font=宋体]2.5[/font][font=宋体]权重系数计算[/font][/b][font=宋体] 光谱模型不同,对盲测样本的预测能力不同,结合光谱模型的模型相关系数([/font][font='Times New Roman',serif]R2[/font][font=宋体]值)或者均方根误差([/font][font='Times New Roman',serif]RMSECV[/font][font=宋体]值)计算各个模型的预测权重,以模型相关系数为例:[/font][align=center][font='Times New Roman',serif]Ti=Ri/(R1+R2+R3+R4)[/font][/align][font=宋体] 其中,[/font][font='Times New Roman',serif]R1[/font][font=宋体]为基础模型[/font][font='Times New Roman',serif]A[/font][font=宋体]的模型相关系数,[/font][font='Times New Roman',serif]R2[/font][font=宋体]为基础模型[/font][font='Times New Roman',serif]B[/font][font=宋体]的模型相关系数,依此类推。[/font][font='Times New Roman',serif]Ti[/font][font=宋体]为各个基础模型对应权重系数。[/font][b][font=宋体]2.6[/font][font=宋体]多模型加权预测[/font][/b][font=宋体] 分别采用光谱基础模型[/font][font='Times New Roman',serif]A[/font][font=宋体]、[/font][font='Times New Roman',serif]B[/font][font=宋体]、[/font][font='Times New Roman',serif]C[/font][font=宋体]、[/font][font='Times New Roman',serif]D[/font][font=宋体]对盲测集[/font][font='Times New Roman',serif]100[/font][font=宋体]个样本进行预测,以盲测集单个样本为例,四个光谱模型对应获取四个预测值[/font][font='Times New Roman',serif]a[/font][font=宋体]、[/font][font='Times New Roman',serif]b[/font][font=宋体]、[/font][font='Times New Roman',serif]c[/font][font=宋体]、[/font][font='Times New Roman',serif]d [/font][font=宋体],结合权重系数计算最终单一预测值[/font][font='Times New Roman',serif]S[/font][font=宋体]:[/font][align=center][font=宋体][/font][/align][align=center][font='Times New Roman',serif]S=a*T1+b*T2+c*T3+d*T4[img=多模型加权预测,690,212]https://ng1.17img.cn/bbsfiles/images/2023/09/202309042106560595_5692_5075516_3.png!w690x212.jpg[/img][/font][/align][b][size=18px][font=宋体]3[/font][font=宋体]、实际应用[/font][/size][font=宋体]3.1[/font][font=宋体]硬件信息[/font][/b][font=宋体] 硬件设备为四川长虹研发的[/font][font='Times New Roman',serif]PV800-III[/font][font=宋体]便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url],光谱仪波段范围为[/font][font='Times New Roman',serif]1350nm-2150nm[/font][font=宋体],采样间隔为[/font][font='Times New Roman',serif]6nm[/font][font=宋体],尺寸为[/font][font='Times New Roman',serif]Φ100mm×76.8mm[/font][font=宋体],重量约[/font][font='Times New Roman',serif]750g。[/font][b][font=宋体]3.2[/font][font=宋体]样本采集:[/font][/b][font=宋体] 采集[/font][font='Times New Roman',serif]400[/font][font=宋体]个酒醅样品,其中酒醅水分、淀粉、酸度等理化指标均由车间经验丰富化验员按常规化学方法测定所得。[/font][b][font=宋体]3.3[/font][font=宋体]分析对比[/font][/b][font=宋体] 结合酒醅常用的光谱预处理算法及[/font][font='Times New Roman',serif]PLS[/font][font=宋体]单模型建模算法对本应用中酒醅数据进行建模,通过多种预处理组合优化,有效剔除光谱数据中的大量无用信息,并结合[/font][font='Times New Roman',serif]PLS[/font][font=宋体]算法,将高维光谱数据进行有效降维,提升光谱数据的有效性及准确度。最后以[/font][font='Times New Roman',serif]RMSECV[/font][font=宋体]作为模型筛选指标,利用筛选的最优模型对[/font][font='Times New Roman',serif]100[/font][font=宋体]条未知样本进行模型外验证,图[/font][font='Times New Roman',serif]a~c[/font][font=宋体]依次给出了传统单模型水分、酸度、淀粉[/font][font='Times New Roman',serif]3[/font][font=宋体]个指标的模型外预测分布情况,图中横坐标为标定值,纵坐标为预测值,黄色区域为模型允许的误差范围(水分、淀粉允许误差为绝对偏差[/font][font='Times New Roman',serif]±1[/font][font=宋体],酸度允许误差范围为绝对偏差[/font][font='Times New Roman',serif]±0.3[/font][font=宋体]),采用基于多模型加权预测的近红外定量分析方法对上述酒醅光谱数据进行建模,利用筛选的多个光谱模型对相同的[/font][font='Times New Roman',serif]100[/font][font=宋体]条未知样本进行加权预测,图[/font][font='Times New Roman',serif]d~f[/font][font=宋体]依次依次给出了多模型加权预测方法水分、酸度、淀粉[/font][font='Times New Roman',serif]3[/font][font=宋体]个指标的模型外预测分布情况。[/font][img=酒醅定量分析,690,318]https://ng1.17img.cn/bbsfiles/images/2023/09/202309042105316390_239_5075516_3.png!w690x318.jpg[/img][font=宋体] 多模型加权预测方法相较于传统单模型预测方法,各指标准确率均有不同幅度提升,3个指标准确率平均提升约11%。各指标准确率均达到了企业车间应用要求。[/font][b][size=18px][font=宋体]4[/font][font=宋体]、结论[/font][/size][/b][font=宋体] 利用便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url],分别以传统单模型建模方法、多模型加权预测方法进行酿酒车间酒醅各成分光谱建模,并对[/font][font='Times New Roman',serif]100[/font][font=宋体]个未知样本进行模型外预测分析。结果表明,基于多模型加权预测的近红外定量分析方法,可以有效弥补便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]在采样精度、稳定性等方面的不足。相较于单模型建模预测结果,多模型加权预测方法将酒醅样本各成分预测准确率平均提升了约[/font][font='Times New Roman',serif]11%[/font][font=宋体],甚至可有效逼近大型傅里叶光谱仪设备预测效果,是一种可以在便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]快检领域推广应用的实用方法。[/font]

  • 不同炼厂的模型是否可以共用?

    [font=宋体]不同炼厂模型是否可以共用,取决于需要检测的样品和性质。一般来说,不同炼厂的原料和工艺条件不尽相同,因此待检测物料有比较大的差别,在主成分空间中,不同炼厂的物料会出现聚类的情况,不利于建模。但是对于某些和光谱有比较明确线性相关的性质,例如族组成,是可以将不同种类样品和不同炼厂样品建立到同一模型中的。[/font]

  • . 在近红外分析中,哪些情形需要转移近红外模型?如何操作?

    [font=宋体]在近红外定性定量分析中,构建定量校正模型通常要比训练定性类模型投入更高的人力物力成本,在模型投入使用后,以下发生的情形往往需要转移模型,并伴随模型的维护。[/font][font=宋体][font=宋体]([/font][font=Times New Roman]1[/font][font=宋体])维修或更新[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]。当仪器使用到一定的年限时,要关注仪器[/font][font=Times New Roman]D[/font][/font][font='Times New Roman']Q[/font][font=宋体][font=Times New Roman]/I[/font][/font][font='Times New Roman']Q[/font][font=宋体][font=Times New Roman]/O[/font][/font][font='Times New Roman']Q/PQ[/font][font=宋体][font=宋体]的历史文件,重视仪器[/font][font=Times New Roman]I[/font][/font][font='Times New Roman']Q[/font][font=宋体][font=Times New Roman]/O[/font][/font][font='Times New Roman']Q/PQ[/font][font=宋体][font=宋体]验证确认信息和可能出现的预警信息。若需要维修或升级更换光谱仪,到这个时候,通过多年积淀的模型,其价值往往是新仪器的数倍,用户最希望的是将原机模型[/font][font=宋体]“硬拷贝”至维修后的仪器上或新的光谱仪上就能正常使用,免去繁琐的“软拷贝”转移模型,这就要求新旧[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]必须具有优良的光学性能,仪器之间的性能差异最小,测量结果具有很好的重现性。但事实上,同厂家同型号同一个批次生产的光谱仪都很难做到这一点,往往需要采用合适的模型转移方法来转移模型。维修或更新仪器,合理的操作方法是,在更换采样附件、光源和检测器等一些光学元器件或旧仪器还没有退役之前,尽量考虑使用同厂家的元器件或同类型的升级产品,在严格履行完整的仪器设备[/font][font=Times New Roman]4[/font][/font][font='Times New Roman']Q[/font][font=宋体][font=宋体]([/font][font=Times New Roman]D[/font][/font][font='Times New Roman']Q[/font][font=宋体][font=Times New Roman]/I[/font][/font][font='Times New Roman']Q[/font][font=宋体][font=Times New Roman]/O[/font][/font][font='Times New Roman']Q/PQ[/font][font=宋体])验证确认程序条件下,完成模型转移和评估工作,使新旧仪器平稳交接,这样,既可降低模型转移的难度,又可保证测量结果的重现性。[/font][font=宋体][font=宋体]([/font][font=Times New Roman]2[/font][font=宋体])增加仪器扩大分析检测规模或范围。如果近红外分析检测工作量加大,待测样品来源、范围仍在校正样品的空间范围之内,满足校正模型内插分析要求,那么,选择合适的模型转移方法,“软拷贝”或“硬拷贝”转移模型即可。如果待测样品来源新产区,在[/font][/font][font='Times New Roman']PCA[/font][font=宋体]主成分空间中与原校正样品[/font][font='Times New Roman'][font=宋体]没有形成[/font][/font][font=宋体]显著的[/font][font='Times New Roman'][font=宋体]异常分布或聚类,马氏距离[/font][/font][font=宋体]在[/font][font='Times New Roman']([/font][img=,55,24]https://ng1.17img.cn/bbsfiles/images/2024/06/202406230935279400_5241_6418678_3.png!w55x24.jpg[/img][font='Times New Roman'])[/font][font=宋体] [font=Times New Roman]~ 3[/font][font=宋体]的范围之内,这时,在完成模型转移后,应在原校正样品集中添加新产区的代表性样品,扩展原模型校正样品空间范围,增强原模型的适应性。如果添加的代表性样品的[/font][/font][font='Times New Roman'][font=宋体]马氏距离[/font][/font][font=宋体][font=宋体]大于[/font][font=Times New Roman]3[/font][font=宋体],远离原校正样品总体平均水平,在[/font][/font][font='Times New Roman']PCA[/font][font=宋体]主成分空间中与原校正样品形成明显的[/font][font='Times New Roman'][font=宋体]异常分布或聚类,[/font][/font][font=宋体]则无需转移模型,应针对新产区重建新模型。[/font]

  • 【原创大赛】XGBoost数学模型及Stacking模型融合

    【原创大赛】XGBoost数学模型及Stacking模型融合

    [font='times new roman'][size=16px][b]X[/b][/size][/font][font='times new roman'][size=16px][b]GBoost[/b][/size][/font][font='times new roman'][size=16px][b]数学模型[/b][/size][/font][font='times new roman'][size=16px][b]及[/b][/size][/font][font='times new roman'][size=16px][b]Stacking[/b][/size][/font][font='times new roman'][size=16px][b]模型融合[/b][/size][/font][font='times new roman'][size=16px][b]X[/b][/size][/font][font='times new roman'][size=16px][b]GBoost[/b][/size][/font][font='times new roman'][size=16px][b]数学模型[/b][/size][/font][size=14px]Xgboost[/size][font='times new roman'][size=14px][63][/size][/font][size=14px]是一种串行的集成学习算法。其思想是生成一串[/size][size=14px]CART[/size][size=14px]回归树,每一棵回归树都是对上一棵回归[/size][size=14px]树预测[/size][size=14px]的值与目标值的残差进行拟合,直到达到设定的树的数目或者函数得到收敛提前停止。[/size][size=14px]Xgboost[/size][size=14px]以其准确率较高的优势在工业界广泛应用。[/size][size=14px]Xgboost[/size][size=14px]的目标函数是由损失函数和正则化两项,由于所要解决的是回归问题,损失函数选择平方损失函数,目标函数如下:[/size][align=right][size=14px] [/size][size=14px] [/size][/align][size=14px]式中,[/size][size=14px]为第[/size][size=14px][i]i[/i][/size][size=14px]个[/size][size=14px]样本的实际值,[/size][size=14px]为第[/size][size=14px][i]i[/i][/size][size=14px]个[/size][size=14px]样本的预测值,[/size][size=14px]为树的深度。[/size][size=14px] [/size][size=14px] [/size][size=14px]Xgboost[/size][size=14px]模型的预测得分是所有回归树的预测得分之[/size][size=14px]和[/size][size=14px]。[/size][align=right][size=14px] [/size][size=14px] [/size][/align][size=14px]假设我们第[/size][size=14px][i]n[/i][/size][size=14px]次迭代训练的树的模型是[/size][size=14px],则在[/size][size=14px][i]n[/i][/size][size=14px]次迭代后的预测结果为:[/size][align=right][size=14px] [/size][size=14px] [/size][/align][size=14px]这样,可以将目标函数改写为[/size][align=right][size=14px] [/size][size=14px] (4-9)[/size][/align][size=14px]为了找到[/size][size=14px][i]f[/i][/size][font='times new roman'][size=14px][i]t[/i][/size][/font][size=14px]([/size][size=14px][i]x[/i][/size][font='times new roman'][size=14px][i]i[/i][/size][/font][size=14px])[/size][size=14px]使得目标函数最小化,在[/size][size=14px][i]f[/i][/size][font='times new roman'][size=14px][i]t[/i][/size][/font][size=14px]([/size][size=14px][i]x[/i][/size][font='times new roman'][size=14px][i]i[/i][/size][/font][size=14px])[/size][size=14px]=0[/size][size=14px]处进行[/size][size=14px]泰勒二阶[/size][size=14px]展开,目标函数近似为:[/size][align=right][size=14px] [/size][size=14px] [/size][/align][size=14px]式中,[/size][size=14px][i]G[/i][/size][font='times new roman'][size=14px][i]i[/i][/size][/font][size=14px]为一阶导数,[/size][size=14px][i]h[/i][/size][font='times new roman'][size=14px][i]i[/i][/size][/font][size=14px]为二阶导数。[/size][size=14px]简化目标函数为:[/size][align=right][size=14px] [/size][size=14px] [/size][/align][size=14px]求得最优的[/size][size=14px]和目标函数公式为:[/size][align=right][size=14px] [/size][size=14px] [/size][/align][font='times new roman'][size=16px][b]4.[/b][/size][/font][font='times new roman'][size=16px][b]3[/b][/size][/font][font='times new roman'][size=16px][b].[/b][/size][/font][font='times new roman'][size=16px][b]2 [/b][/size][/font][font='times new roman'][size=16px][b]构建[/b][/size][/font][font='times new roman'][size=16px][b]树[/b][/size][/font][font='times new roman'][size=16px][b]模型[/b][/size][/font][size=14px]为了能够达到最精确的结果,在构建回归树时,特征分裂采用贪心算法。从树的根节点开始,直到分裂到深度为[/size][size=14px][i]n[/i][/size][size=14px],算法的伪代码如下:[/size][size=14px]贪心算法在每个节点上遍历全部的特征,其中得分最高的节点作为分裂节点,在到达树设定的最大深度后停止分裂,然后再继续构造下一棵树的残差。将生成的所有的树进行组合,这样就得到了[/size][size=14px]XGBoost[/size][size=14px]模型。[/size][size=14px]XGBoost[/size][size=14px]模型构建过程示意图如下图所示。[/size][align=center][font='times new roman'][size=16px]XGBoost[/size][/font][font='times new roman'][size=16px]模型构建过程示意图[/size][/font][/align][font='times new roman'][size=16px][b]XGBoost[/b][/size][/font][font='times new roman'][size=16px][b]训练[/b][/size][/font][font='times new roman'][size=16px][b]过程[/b][/size][/font][size=14px]将数据集进行归一化处理并且按照[/size][size=14px]7[/size][size=14px]:[/size][size=14px]3[/size][size=14px]的比例分成训练集和预测集,然后用[/size][size=14px]XGBoost[/size][size=14px]对训练集数据进行训练。[/size][size=14px]XGBoost[/size][size=14px]训练过程如下。[/size][size=14px]([/size][size=14px]1[/size][size=14px])在[/size][size=14px]XGBoost[/size][size=14px]模型中输入训练集的特征向量及标签。[/size][size=14px]([/size][size=14px]2[/size][size=14px])用已经训练好的[/size][size=14px]基学习器[/size][size=14px]对训练集进行预测,得到模型预测值与样本真实值的残差。[/size][size=14px]([/size][size=14px]3[/size][size=14px])对特征向量进行初始化,计算在分割点处分割后的损失函数与分割前的变化。[/size][size=14px]([/size][size=14px]4[/size][size=14px])对当前[/size][size=14px]基学习器[/size][size=14px]分裂的深度进行计算。若达到了最大分裂深度,则停止分裂,当前[/size][size=14px]基学习器[/size][size=14px]完成建立并得到左右叶子节点权重;若没有达到最大分裂深度,则寻找新的最优分割点,并将样本分配到分割点的左右节点,进行步骤([/size][size=14px]3[/size][size=14px])。[/size][size=14px]([/size][size=14px]5[/size][size=14px])判断是否达到终止条件([/size][size=14px]基学习器[/size][size=14px]数量达到预设值)。若达到终止条件,将所有的[/size][size=14px]基学习器[/size][size=14px]组合起来,训练结束。若未达到,进行步骤([/size][size=14px]2[/size][size=14px])。[/size][size=14px]XGBoost[/size][size=14px]训练流程如下图所示。[/size][align=center][font='times new roman'][size=16px] [/size][/font][font='times new roman'][size=16px]XGBoost[/size][/font][font='times new roman'][size=16px]训练流程图[/size][/font][/align][font='times new roman'][size=16px][b]XGBoost[/b][/size][/font][font='times new roman'][size=16px][b]预测结果[/b][/size][/font][font='times new roman'][size=16px][b] [/b][/size][/font][size=14px]对训练集数据进行归一化后进行十折交叉验证,得到[/size][size=14px]RMSE[/size][size=14px]为[/size][size=14px]0.[/size][size=14px]133[/size][size=14px],将模型对归一化后的预测集数据进行预测,得到结果为[/size][size=14px]0.127[/size][size=14px]。[/size][size=14px]XGBoost[/size][size=14px]模型在预测集上损失函数图如下图所示。[/size][align=center][img]https://ng1.17img.cn/bbsfiles/images/2020/09/202009031801536210_9873_3890113_3.png[/img][/align][align=center][font='times new roman'][size=16px]XGBoost[/size][/font][font='times new roman'][size=16px]损失函数图[/size][/font][/align][font='times new roman'][size=16px][b]Stacking[/b][/size][/font][font='times new roman'][size=16px][b]模型融合[/b][/size][/font][font='times new roman'][size=16px][b]Stacking[/b][/size][/font][font='times new roman'][size=16px][b]算法原理[/b][/size][/font][size=14px]Stacking[/size][font='times new roman'][size=14px][64][/size][/font][size=14px]是一种集成学习框架。一般分为两层学习过程:首先对原始数据集进行拆分,得到许多个子数据集,[/size][size=14px] Stacking[/size][size=14px]框架中第一层模型由[/size][size=14px]基学习器[/size][size=14px]组成,每个[/size][size=14px]基学习器[/size][size=14px]对应着[/size][size=14px]一[/size][size=14px]个子数据集,求出每个[/size][size=14px]基学习器[/size][size=14px]的预测结果。然后,将第一层模型[/size][size=14px]基学习器[/size][size=14px]得到的预测值作为第二层模型的输入,由第二层模型输出最终结果[/size][font='times new roman'][size=14px][65][/size][/font][size=14px]。其学习方式如下图所示。[/size][align=center][font='times new roman'][size=16px]Stacking[/size][/font][font='times new roman'][size=16px]集成学习方式[/size][/font][/align][size=14px]对于数据集[/size][size=14px][i]S[/i][/size][size=14px]={([/size][size=14px][i]x[/i][/size][font='times new roman'][size=14px][i]n[/i][/size][/font][size=14px][i],y[/i][/size][font='times new roman'][size=14px][i]n[/i][/size][/font][size=14px]),[/size][size=14px][i]n[/i][/size][size=14px]=[/size][size=14px]1[/size][size=14px],2,3…[/size][size=14px][i]N[/i][/size][size=14px]},[/size][size=14px][i]x[/i][/size][font='times new roman'][size=14px][i]n[/i][/size][/font][size=14px]和[/size][size=14px][i]y[/i][/size][font='times new roman'][size=14px][i]n[/i][/size][/font][size=14px]分别表示第[/size][size=14px][i]n[/i][/size][size=14px]个[/size][size=14px]样本特征向量和对应的标签值。将原始数据集[/size][size=14px][i]S[/i][/size][size=14px]按照随机的方法分成[/size][size=14px][i]T[/i][/size][size=14px]个[/size][size=14px]规模差不多大的子集[/size][size=14px][i]S[/i][/size][font='times new roman'][size=14px][i]1[/i][/size][/font][size=14px],[/size][size=14px][i]S[/i][/size][font='times new roman'][size=14px][i]2[/i][/size][/font][size=14px],[/size][size=14px]…[/size][size=14px][i]S[/i][/size][font='times new roman'][size=14px][i]T[/i][/size][/font][size=14px],[/size][size=14px]定义[/size][size=14px][i]S[/i][/size][font='times new roman'][size=14px][i]t[/i][/size][/font][size=14px]和[/size][size=14px][i]S[/i][/size][font='times new roman'][size=14px]-[/size][/font][font='times new roman'][size=14px][i]t[/i][/size][/font][size=14px]=[/size][size=14px][i]S[/i][/size][size=14px]-[/size][size=14px][i]S[/i][/size][font='times new roman'][size=14px][i]t[/i][/size][/font][size=14px]分别为交叉验证中第[/size][size=14px][i]t[/i][/size][size=14px]折的测试集和训练集。在第一层预测模型中总共有[/size][size=14px][i]T[/i][/size][size=14px]个基学习器[/size][size=14px],每个[/size][size=14px]基学习器[/size][size=14px]对相应的子训练集进行训练,得到基模型[/size][size=14px][i]L[/i][/size][font='times new roman'][size=14px][i]t[/i][/size][/font][size=14px],[/size][size=14px][i]t[/i][/size][size=14px]=1,2,3,…,[/size][size=14px][i]T[/i][/size][size=14px]。[/size][size=14px]在完成交叉验证后,每个[/size][size=14px]基学习器[/size][size=14px]会得到一个输出结果,将得到的这些结果组合起来当作第二层预测模型的输入样本[/size][size=14px][i]S[/i][/size][font='times new roman'][size=14px]2[/size][/font][size=14px]。用第二层预测模型中的算法对[/size][size=14px][i]S[/i][/size][font='times new roman'][size=14px]2[/size][/font][size=14px]进行整理得到[/size][size=14px]元学习器[/size][size=14px][i]L[/i][/size][font='times new roman'][size=14px]2[/size][/font][size=14px],而且在整理的过程中可以不断地对第一层预测模型中的误差进行修正,提高模型的预测准确度。[/size][size=14px]Stacking[/size][size=14px]模型训练的部分伪代码如下:[/size][size=14px][b]In[/b][/size][size=14px][b]put[/b][/size][size=14px]:[/size][size=14px][i]S[/i][/size][size=14px]={[/size][size=14px]([/size][size=14px][i]x[/i][/size][font='times new roman'][size=14px][i]n[/i][/size][/font][size=14px],[/size][size=14px][i]y[/i][/size][font='times new roman'][size=14px][i]n[/i][/size][/font][size=14px]),[/size][size=14px][i]n[/i][/size][size=14px]=1,2,3,…,[/size][size=14px][i]N[/i][/size][size=14px]}[/size][size=14px][b]step1[/b][/size][size=14px]:将数据[/size][size=14px]集按照[/size][size=14px]随机的方法分成[/size][size=14px][i]T[/i][/size][size=14px]个[/size][size=14px]规模差不多的子集[/size][size=14px][i]S[/i][/size][font='times new roman'][size=14px][i]1[/i][/size][/font][size=14px],[/size][size=14px][i]S[/i][/size][font='times new roman'][size=14px][i]2[/i][/size][/font][size=14px],[/size][size=14px]…,[/size][size=14px][i]S[/i][/size][font='times new roman'][size=14px][i]t[/i][/size][/font][size=14px][b]step2[/b][/size][size=14px]:[/size][size=14px][b]for[/b][/size][size=14px] [/size][size=14px][i]t[/i][/size][size=14px]=1 [/size][size=14px][b]to[/b][/size][size=14px] T [/size][size=14px][b]do[/b][/size][size=14px] [/size][size=14px]在训练集上用第一层预测模型中的[/size][size=14px]基学习器[/size][size=14px][i]L[/i][/size][font='times new roman'][size=14px][i]t[/i][/size][/font][size=14px]进行训练[/size][size=14px] [/size][size=14px][b]end[/b][/size][size=14px][b]step[/b][/size][size=14px][b]3[/b][/size][size=14px][b]:[/b][/size][size=14px]构建新数据集[/size][size=14px][i]S[/i][/size][font='times new roman'][size=14px]2[/size][/font][size=14px]。[/size][size=14px][b]step[/b][/size][size=14px][b]4[/b][/size][size=14px][b]:[/b][/size][size=14px]在第二程预测模型中用[/size][size=14px]元学习器[/size][size=14px][i]L[/i][/size][font='times new roman'][size=14px]2[/size][/font][size=14px]对[/size][size=14px][i]S[/i][/size][font='times new roman'][size=14px]2[/size][/font][size=14px]进行训练。[/size][size=14px][b]output[/b][/size][size=14px]:[/size][size=14px][i]y[/i][/size][font='times new roman'][size=14px][i]npre[/i][/size][/font][size=14px]。[/size][font='times new roman'][size=16px][b]构建[/b][/size][/font][font='times new roman'][size=16px][b]Stacking[/b][/size][/font][font='times new roman'][size=16px][b]模型[/b][/size][/font][size=14px]不同的算法模型会从不同的数据特征空间以及不同的角度来对数据进行观测,根据各自算法的特点建立不同的模型来预测新的数据,这就会使得单一的算法会有一定局限性,不能够全方位的认识数据,用不同的模型进行融合可以从各个角度认识数据,可以提升预测的准确度[/size][font='times new roman'][size=14px][66][/size][/font][size=14px]。[/size][size=14px]第一层预测模型除了[/size][size=14px]BP[/size][size=14px]神经网络和[/size][size=14px]XGBoost[/size][size=14px]以外,还选择了在[/size][size=14px]3.2.2[/size][size=14px]节波段选择表现较好的[/size][size=14px]bagging[/size][size=14px]集成学习算法[/size][size=14px]RF[/size][size=14px]、以[/size][size=14px]boosting[/size][size=14px]学习方式的集成算法的梯度提升决策树([/size][size=14px]gradient[/size][size=14px] [/size][size=14px]boosted[/size][size=14px] [/size][size=14px]decision[/size][size=14px] [/size][size=14px]tree[/size][size=14px],[/size][size=14px]GDBT[/size][size=14px])和在样本少、非线性数据集上表现良好的[/size][size=14px]SVM[/size][size=14px]算法。第二层预测模型需要选择泛化能力较强,预测结果较为准确,并且可以防止过拟合的学习算法,[/size][size=14px]XGBoost[/size][size=14px]算法效果最好,因此选用[/size][size=14px]XGBoost[/size][size=14px]作为第二层模型。综上所述,[/size][size=14px]Stacking[/size][size=14px]模型的第一层预测模型为[/size][size=14px]BP[/size][size=14px]网络、[/size][size=14px]XGBoost[/size][size=14px]、[/size][size=14px]RF[/size][size=14px]、[/size][size=14px]GDBT[/size][size=14px]和[/size][size=14px]SVM[/size][size=14px],第二层预测模型为[/size][size=14px]XGBoost[/size][size=14px]。[/size][size=14px]为了防止模型发生过拟合,对于五个[/size][size=14px]基学习器[/size][size=14px]按照时间维度划分成五个数据集,并保证每次训练过程[/size][size=14px]不同基学习[/size][size=14px]器用的验证集不相同。对于每个[/size][size=14px]基学习器[/size][size=14px],每次训练将四个数据集作为训练集,剩余的一个作为验证集,最终将五个[/size][size=14px]基学习器[/size][size=14px]的预测结果合并成新的数据集。[/size][font='times new roman'][size=16px][b]Stacking[/b][/size][/font][font='times new roman'][size=16px][b]模型融合结果[/b][/size][/font][size=14px]对原始数据集进行归一化并按比例随机拆分成[/size][size=14px]70%[/size][size=14px]的训练集和[/size][size=14px]30%[/size][size=14px]的预测集。分别用[/size][size=14px]XGBoost[/size][size=14px]、[/size][size=14px]RF[/size][size=14px]、[/size][size=14px]GDBT[/size][size=14px]、[/size][size=14px]BP[/size][size=14px]网络、[/size][size=14px]SVR[/size][size=14px]进行建模和[/size][size=14px]Stacking[/size][size=14px]进行建模,建模结果如下表所示。[/size][align=center][font='times new roman'][size=16px]各[/size][/font][font='times new roman'][size=16px]模型超[/size][/font][font='times new roman'][size=16px]参数及预测结果[/size][/font][/align][table][tr][td][align=center][size=13px]算法名称[/size][/align][/td][td][align=center][size=13px]超参数集[/size][/align][/td][td][align=center][size=13px]RMSE[/size][font='times new roman'][size=13px]CV[/size][/font][/align][/td][td][align=center][size=13px]RMSE[/size][font='times new roman'][size=13px]P[/size][/font][/align][/td][td][align=center][size=13px]训练时间[/size][/align][/td][/tr][tr][td][align=center][size=13px]XGBoost[/size][/align][/td][td][align=center][size=13px]树深度为[/size][size=13px]5[/size][size=13px],树的数目为[/size][size=13px]200[/size][size=13px],最小叶子节点权重为[/size][size=13px]2[/size][size=13px],学习率为[/size][size=13px]0.[/size][size=13px]1[/size][/align][/td][td][align=center][size=13px]0.[/size][size=13px]133[/size][/align][/td][td][align=center][size=13px]0.[/size][size=13px]127[/size][/align][/td][td][align=center][size=13px]17.[/size][size=13px]18[/size][size=13px]s[/size][/align][/td][/tr][tr][td][align=center][size=13px]RF[/size][/align][/td][td][align=center][size=13px]树的数目为[/size][size=13px]30[/size][size=13px],树的最大深度为[/size][size=13px]3[/size][size=13px],最小叶子节点样本数目为[/size][size=13px]1[/size][/align][/td][td][align=center][size=13px]0.[/size][size=13px]153[/size][/align][/td][td][align=center][size=13px]0.[/size][size=13px]160[/size][/align][/td][td][align=center][size=13px]18.[/size][size=13px]12[/size][size=13px]s[/size][/align][/td][/tr][tr][td][align=center][size=13px]GDBT[/size][/align][/td][td][align=center][size=13px]学习率为[/size][size=13px]0.[/size][size=13px]1[/size][size=13px],迭代次数为[/size][size=13px]400[/size][size=13px],节点划分最小样本数为[/size][size=13px]2[/size][size=13px],树的最大深度为[/size][size=13px]3[/size][/align][/td][td][align=center][size=13px]0.[/size][size=13px]165[/size][/align][/td][td][align=center][size=13px]0.[/size][size=13px]161[/size][/align][/td][td][align=center][size=13px]17.[/size][size=13px]56[/size][size=13px]s[/size][/align][/td][/tr][tr][td][align=center][size=13px]BP[/size][size=13px]网络[/size][/align][/td][td][align=center][size=13px]激活函数为[/size][size=13px]relu[/size][size=13px],最大迭代次数为[/size][size=13px]500[/size][/align][/td][td][align=center][size=13px]0.[/size][size=13px]182[/size][/align][/td][td][align=center][size=13px]0.[/size][size=13px]179[/size][/align][/td][td][align=center][size=13px]167.[/size][size=13px]31[/size][size=13px]s[/size][/align][/td][/tr][tr][td][align=center][size=13px]SVR[/size][/align][/td][td][align=center][size=13px]核函数为径向基函数,惩罚系数为[/size][size=13px]20[/size][/align][/td][td][align=center][size=13px]0.[/size][size=13px]187[/size][/align][/td][td][align=center][size=13px]0.185[/size][/align][/td][td][align=center][size=13px]60.[/size][size=13px]35[/size][size=13px]s[/size][/align][/td][/tr][tr][td][align=center][size=13px]Stacking[/size][/align][/td][td][align=center][size=13px]以上模型进行融合[/size][/align][/td][td][align=center][size=13px]0.[/size][size=13px]101[/size][/align][/td][td][align=center][size=13px]0.[/size][size=13px]104[/size][/align][/td][td][align=center][size=13px]335.[/size][size=13px]44[/size][size=13px]s[/size][/align][/td][/tr][/table][size=14px]由表可以看出,[/size][size=14px] Stacking[/size][size=14px]模型融合在验证集上的用交叉验证得到的[/size][size=14px]RMSE[/size][size=14px]结果为[/size][size=14px]0.[/size][size=14px]101[/size][size=14px],在预测集上的结果为[/size][size=14px]0.[/size][size=14px]104[/size][size=14px],说明模型融合的方法较单个模型效果要好[/size][size=14px]。[/size]

Instrument.com.cn Copyright©1999- 2023 ,All Rights Reserved版权所有,未经书面授权,页面内容不得以任何形式进行复制