分类与回归树(Classification and regression trees, CART)是由四位美国统计学家于1970年提出的一种非常有效的非参数分类和回归的统计学方法。它通过构建二叉树达到预测目的,包括分类树和回归树。CART能同时进行样本的分类或回归与变量的选择。然而,CART算法具有不稳定性,即自变量X较小的变化可引起树结构很大的变化。蒙特卡罗采样后多次结果的统计值恰好具有提高结果稳定性这一优势。将蒙特卡罗与CART的分类树结合,就是蒙特卡罗树(Monte Carlo classification tree algorithm, MCTree)的方法[41],该方法可以同时用于样本分类与特征变量的选择。首先用蒙特卡罗随机分组技术将校正集产生很多校正子集和验证集,其中校正子集用来构建分类树,验证集使用模糊修剪策略对树进行修剪。每次的校正子集会产生一个分类树,从分类树可以得到样本的分类情况及跟分类相关的特征变量。将这多棵树的结果进行统计,每个变量重要性的平均值即为最终输出的变量重要性指标。