savedown
第16楼2012/01/10
空间是无穷维的,我们的测量数据存在于有限维的子空间,如果空间的维度不对,就意味着损失了数据或者增加了不必要的干扰。所以确定维度对于子空间描述是至关重要的,但是维度对了,并不能确保子空间的划定就是准确的,所以维度的正确是定量准确的必要条件。
有点晕? :) 没关系,这个可以不懂。
第一主元可以被认为是最明显因素,但实际上,这样会误导人。PCA实际上是数据驱动方法,不太讲理,分量的可解释性差是其软肋。相较之下,ICA更讲理一些,有兴趣可以看看。
wendy_haohao
第19楼2012/01/16
比如具体到不同地域牛奶分类的例子上,NIRQUEST256 的得到256个数据,并非是全部有用的,通过主成分分析,会得到需要两个成分就可以判断牛奶产自哪个地方,首先主要特征是蛋白与水的比例,第二主要特征是蛋白质B的含量。那么该比例就是主成分,而B含量就是主成分二,这样一来对于光谱数据的处理就会大大简化了,假如第20和第200个数据的比例可以告知比例值,第100个数据可以告知B含量,那么只需要知道三个数据就可以进行牛奶地域的划分了。当然这是最简单的情况,实际上牛奶分类可能的主成分不只是两个数据的比值,而是数据在特征空间的投影的比值。矩阵的方法是用来计算特征是什么的工具,关键是理解其中的过程