A.M.C.戴维斯gydF4y2Ba一个gydF4y2Ba和汤姆·费恩看来gydF4y2BabgydF4y2Ba
一个gydF4y2Ba诺里奇近红外咨询公司75年Intwood路,Cringleford,诺维奇NR4 6 aa,英国。电子邮件:gydF4y2Ba(电子邮件保护)gydF4y2Ba
bgydF4y2Ba部门统计科学,伦敦大学学院,英国伦敦WC1E 6 bt,高尔街。电子邮件:gydF4y2Ba(电子邮件保护)gydF4y2Ba
介绍gydF4y2Ba
在我们前一列gydF4y2Ba1gydF4y2Ba我们介绍了一些距离数据,用于光谱进行比较。这些计算提供单变量的答案从多元数据在一个单一的步骤。这可能是足够的对于某些问题,但我们常常需要采用一些多元数学之前减少一个单变量的答案。gydF4y2Ba
本专栏介绍第一种方法,这是发明之前由R.A.费舍尔化学计量学;大约七十年前!典型变量分析(CVA)gydF4y2Ba2gydF4y2Ba化学计量学的一直是我最喜欢的例子,因为它通常需要使用压缩技术(例如PCA或FFT)后,就可以应用,我认为它可以帮助学生了解需要知道的基本性质不同的工具在最优化工具箱。gydF4y2Ba
托尼•戴维斯gydF4y2Ba
组gydF4y2Ba
多变量分析的光谱数据比较是很不寻常的一个未知的一个已知样本的光谱。是正常采集光谱从几个例子相同的样本组和比较未知谱组。这是因为当我们测量不同实例之间总是会有一些变化,我们需要信息的可变性。事实上仪器噪声确保光谱测量相同的例子在同一仪器会有些变化。gydF4y2Ba
典型变量分析gydF4y2Ba
与PCA CVA的技术有相似之处的多元数据提交给项目计算新变量和值(分数)为每一个样本,每一个新变量。PCA新变量的主成分,而在CVA的正则变量。然而,所不同的是在新变量是如何选择的。PCA不给任何组织和组成员信息,它只是需要计算新变量最大化分数的变化给出了整个数据集。患者组和组成员信息和要求是新变量将最小化类内变化,同时最大化群体间的变异。如图1所示(a)和(b),类内方差,gydF4y2BaWgydF4y2BaggydF4y2Ba,是一个汇集所有的组织正在考虑的结果。当组有不同的变化,在图1中,gydF4y2BaWgydF4y2BaggydF4y2Ba是一种妥协,但这种方法通常适用尽管如此。gydF4y2Ba
图1所示。计算池的类内方差和群体间的方差与三组患者样本。gydF4y2Ba
BgydF4y2BaggydF4y2Ba是组间方差和标准比率最大化gydF4y2BaBgydF4y2BaggydF4y2Ba/gydF4y2BaWgydF4y2BaggydF4y2Ba。gydF4y2Ba
应用脑血管意外,输入变量的数量必须小于(实际上大大小于)样本的数量。这带来了困难与光谱数据通常有大量的变量(波长或波数)。可能的解决方案是对丢弃的大多数点或(如前所述)使用某种形式的压缩保留最原始数据中的信息,但压缩到更少的变量。其中最明显的是主成分分析。gydF4y2Ba
PCA和脑血管意外的区别之一是,分数的转换从原始变量PCA是一个简单的旋转的轴保持相互正交的。在CVA的轴之间的角度和轴的伸缩变化,描述类内变化(和相应的椭圆形状gydF4y2BaWgydF4y2BaggydF4y2Ba)成为一个圆形或球形。结果,测量使用欧氏距离CV-space对应使用Mahalanobis距离在原始光谱空间中,并使用CVA分类方法相当于分类使用距离(参见我们经常引用的书gydF4y2Ba3gydF4y2Ba一个描述的距离)。gydF4y2Ba
例子gydF4y2Ba
一)两组gydF4y2Ba
在两组我们需要找到只有一个简历。中提到的例子是第一个“最优化列”gydF4y2Ba半岛综合体育官方APP下载德甲光谱学的世界gydF4y2Ba4gydF4y2Ba在早期的“托尼·戴维斯列”。gydF4y2Ba5gydF4y2Ba它包括常规的分离和脱咖啡因速溶咖啡样品的近红外光谱。图2 (a)的光谱显示,没有分离。当时的光谱包含700点和我们最好的PCA程序只会接受50变量。利用这个程序的一种方法是减少平均波长变量的连续14数据点离开50这些变量可以作为输入数据。然后第十个人电脑被用作CVA的程序输入数据。结果如图2所示(b)。另一种方法是使用傅里叶变换(FT) 25双压缩数据的傅里叶系数作为输入数据主成分分析的程序。脑血管意外的结果显示了前十个人电脑使用图2 (c)。如今,PCA程序接受更大数量的输入变量,但当时这是一个演示压缩由英国《金融时报》的价值和使用价值的化学计量学工具为他们设计的应用程序。gydF4y2Ba
图2。(a)近红外光谱规律和脱咖啡因速溶咖啡,(b)患者使用50点波长域数据结果,(c)患者结果使用50点(25×2)英国《金融时报》的数据。gydF4y2Ba
b)几组gydF4y2Ba
这个例子来自一些以后工作试图识别植物来源的蜂蜜样品的近红外光谱。gydF4y2Ba6gydF4y2Ba二阶导数光谱被用作输入数据主成分分析程序和第十或十五个人电脑被用作CVA的程序输入数据。这工作是非常初步研究,因为有很少的样品可用。使用交叉验证验证工作留下了一个样品,重新计算个人电脑以及CVs。尽管使用的最佳分离三个CVs更容易看前两个。图3(一个)显示了一个特定的示例删除和主成分分析结果图3 (b)显示了CVA的结果从这个数据。这些图是一个很好的例子证明CVA的PCA相比的优越的力量将类似的样品。许多人使用PCA识别;工作在许多情况下,但它只能偶然,因为变化的数据样本之间的差异有关。PCA是一个“无监督方法”不能使用组成员信息来提高分离。gydF4y2Ba
图3。(a)成绩的前两个电脑指示的位置金合欢样本(圆圈)48蜂蜜样品的分布。方形符号表示一个相思的位置被排除在主成分分析的样品。前两个CVs (b)的情节。蜂蜜的四组每组由0.95表示信心边界周围。方形符号表示的计算位置金合欢示例省略的分析。gydF4y2Ba
即将到来的gydF4y2Ba
在我们下一篇专栏文章中我们将讨论最近发达SIMCA方法并讨论之前必须考虑的其他因素歧视的决定。gydF4y2Ba
引用gydF4y2Ba
- A.M.C.戴维斯和t•费恩gydF4y2Ba半岛综合体育官方APP下载德甲光谱学欧洲bdapp官方下载安卓版gydF4y2Ba20.gydF4y2Ba(2)15 (2008)gydF4y2Ba。gydF4y2Ba
- R.A.费雪,gydF4y2Ba安。尤金。gydF4y2Ba7gydF4y2Ba,179 - 188 (1936)。gydF4y2Bahttps://doi.org/10.半岛app应用下载1111/j.1469-1809.1936.tb02137.xgydF4y2Ba
- t . Næs伊萨克松t, t·费恩看来,t·戴维斯,gydF4y2Ba一个用户友好的多元校正和分类指南gydF4y2Ba。近红外光谱出版物,奇切斯特(2002)。gydF4y2Ba
- A.M.C.戴维斯gydF4y2Ba半岛综合体育官方APP下载德甲光谱学的世界gydF4y2Ba1 (1)gydF4y2Ba,30 (1989)。gydF4y2Ba
- A.M.C.戴维斯gydF4y2Ba半岛综合体育官方APP下载德甲光谱学欧洲bdapp官方下载安卓版gydF4y2Ba5 (6)gydF4y2Ba,30 (1993)。gydF4y2Ba
- b . Radovic A.M.C.戴维斯,t·费恩看来和大肠AnklamgydF4y2Baj .近红外Spectrosc。gydF4y2Ba10gydF4y2Ba,121 - 135 (2002)。gydF4y2Bahttps://doi.org/10.1255/jnirs.329gydF4y2Ba