doctor
第18楼2009/08/25
在用CAMO计算定量模型时,交叉验证是一种取得最佳主成份数的方式,是必选的选项。在计算好的模型中,可以根据杠杆值对每个样品的影响能力作出判断;而PREE残差则是在取得最佳主成份数的计算过程中产生的一系列残差,最佳主成份数一般是取残差最小时的值。
在计算的多个主成分中,第一主成分最重要,随着主成分数的增加,重要程度依次降低,以至到后来的许多主成分反映的是噪音信息。
如果建立模型时使用的主成分数过少,就不能反应未知样品被测组分产生的光谱数据变化,其模型的预测准确度就会降低,这种情况称之为不充分拟和(Underfit)。
如果使用过多的主成分建立模型,就会将一些代表噪音的主成分加到模型中,使模型的预测能力下降,这种情况称为过度拟和(Overfit)。
因此,合理确定参加建立模型的主成分数是充分利用光谱信息和滤除噪音的有效方法之一。
PRESS值,即预测残差平方和,PRESS是这样计算的:使用一定数目的主成分建立模型,用这个模型对参加建模的每个样品进行预测,每个样品的预测值和已知值的差的平方和即为该主成分下的PRESS值。PRESS值越小,说明模型的预测能力越好。CAMO软件会根据参数设置以交互验证法(Cross-validation)自动选择最佳主成分来构建模型。这是CAMO软件的一个比较好的设计,当然如果你认为软件给出的主成份数不满意,也可以人为来设置。