gcMSsolution工作站数据平滑的几种方法介绍
概述
gcMSsolution色谱质谱数据工作站实现数据平滑的集中方法与基本原理解释
数据平滑的意义
色谱仪或者色谱-质谱联用仪采集到的数据文件,进行平滑之后,可以提高色谱峰的信噪比并降低检出限,是常见的色谱信号的处理手段。需要至于,不良的平滑参数,反而可能会导致检出限上升,或者造成分离度问题,参见https://bbs.instrument.com.cn/topic/7642927。
数据平滑的常见方法
下面以Shimdzu的gcMSsolution色谱-质谱数据工作站为例予以说明,从基本原理上来讲,gcMSsolution工作站本质上可以使用三种数据平滑的方法,标准法,双边法和最小二乘法,如图1所示:
图1 gcMSsolution的数据平滑参数
各种平滑方法的基本原理:
1、移动平均法(包括标准法和双边法)
移动平均法的原理,确定一定的间隔(窗口),将窗口内的数据点取平均值之后替代原始数据点,然后移动到下一个点。不断重复此过程,直至完成全谱图的处理。
实例:例如设定平滑的数据点间隔为7,那么图中的第1数据点至第7数据点进行平均,替换第4数据点。然后窗口向后移动,从第2点至第8点重复此计算过程,以此类推直至数据结束。如图2所示:
图2 移动平均法图示
窗口选择越大,滤波效率越好,但是会造成较大的色谱峰畸变(一般情况下会造成色谱峰宽增加,相邻的色谱峰分离度下降,极端情况下可能会使得相邻几个色谱峰混乱成单个色谱峰)。窗口一般选择小于峰宽的1/10,此即为标准法的基本原理。
双边法为带有权重因子的的移动平均平滑法,如图2,距离第4点越远的数据点,对平滑的贡献越小(因为数据点的强度降低),在平滑计算中赋予其较低的权重。
同时考虑数据点强度的权重的方法,称为双边法平滑。
Shimadzu 的色谱数据工作站LCsolution和Labsolutions内置有Smooth功能,也是使用了移动平均法(类似于gcMSsolution的标准法)。滤波效果如图3所示:
图3 色谱信号平滑前后的比较
2、最小二乘法 (Savitzky-Golay 方法)
Savitzky-Golay法,本质上是采用构造多项式方程来拟合色谱信号的方法去平滑色谱-质谱信号。
首先假设一组数据点服从某个特定的多项式,根据最小二乘的原理,确定出多项式中各项系数。然后用多项式的值代替实验值,实现平滑。
常用的办法是五点二次平滑和七点三次拟合。
算法如下:
七点三次平滑:
五点二次平滑:
总体上,最小二乘法滤波的效果要好于移动平均法(标准法和双边法)。
小结
注意:平滑本质上会丢失原始色谱信号的细节,需要谨慎选择平滑强度。
在一定的范围内增加平滑强度,会改善色谱峰信噪比(这是极为常见的数据处理方法),但如果平滑强度太大,会使得色谱信号高频部分丢失严重。表现为色谱峰峰宽增加,相邻色谱峰的分离度降低,峰高降低,反而会降低信号的信噪比。