半岛综合体育官方APP下载德甲自1975年以来光谱学
瑞士万通广告
越南—广告

最后弗隆(4)多变量回归

A.M.C.戴维斯

诺里奇近红外咨询公司10白杨,Cringleford,诺维奇NR4 6 ua,英国。电子邮件:(电子邮件保护)

介绍

看不到我介绍了多元线性回归(MLR)当我是一个非常初级的实验室在1959年葛兰素实验室助理。葛兰素史克是安装第一台电脑(第三商业电脑在英国!),他们想要让员工放心,它不会导致裁员。重点是计算机能够做什么,目前是不可能的。他们选择高钙的示范和55年之后,我仍然可以想象一个场景显示我们的卡通电影。大厅内挤满了庞大的白胡子数学家使用计算尺,这部电影解释需要计算一个高计算,而计算机只需要几个小时!那些日子以来有很多先进的计算和回归分析。

我第一次使用高真的在1966年研究的因素参与蜂蜜的结晶。我们只有几个变量和一些令人愉快的结果。在1980年我开始从事近红外(NIR)光谱使用乐器和19个过滤器和采用可编程序计算器来计算高半岛综合体育官方APP下载德甲校准。也许我应该指的是更正确的年代步进式高。我的第一个问题是,这个项目只能处理12个变量,所以最初的任务是选择12的19个变量。一个我们从未真正解决的问题除了通过使用这些过滤器是已知吸收分析物被研究。我们迅速转移到使用真实的电脑,第一次修改程序使用19个变量,但仍有困难。获得一个明显有用的结果不是问题,但是想找稳定的解决方案非常困难。这个时候我第一次见到我的朋友和合作者,汤姆•费恩谁正与化学家使用类似的近红外光谱过滤工具。汤姆写了一个程序发现的过滤器”可以产生最佳的效果非常好。 In1982 I persuaded my Institute to buy an NIR grating instrument which produced a spectrum from 1100 nm to 2500 nm measurements at 2 nm intervals; 700 variables! Now we did have problems! My first solution was to borrow Tom’s “best-pair program” but computing regression coefficients for 700 × 699 / 2 = 244,650 answers and trying to sort them was a big task for the small Nova 4 computer which ran the spectrometer. Instead we adopted a two-stage approach by computing a low resolution picture of variables at 40 nm intervals which produce 630 regression coefficients. These were displayed on a colour display (another first in the Institute) and an operator could then find areas of high correlation which were then computed at 2 nm intervals.1

这些显示时,不仅使我们能够找到变量最好的相关性,但相关性周围的形状还表示如果他们可能是稳定的。过了大约20个小时的处理时间但它确实工作!然而,我们被其他over-taken迅速发展。

系统是最新的由汤姆·费恩看来我们的矩阵代数课程的一部分。2在当前MATLAB形式不到5 s的计算和显示结果!

高钙的问题是什么?

我可以生产一长串问题儿童高,入手:多种形式的使用或如何评估结果。这可能是真的,我们不应该使用高钙或SMLR近红外光谱数据,因为数据是高度相关(有时称为共线性)而不是独立变量。然而,不得不说,卡尔·诺里斯(“近红外光谱分析)的父亲一直使用一种特殊形式的SMLR和从未击败Chambersburg”软件枪战”。他成为比赛的一名法官被接受,这样可能会有一个新的赢家!它还说,我们拥有先进水平的专业知识,因为SMLR可以让我们开始。

高技术的进步

介绍了几种技术是解决共线性的问题。最重要的是主成分回归(PCR)和偏最小二乘(PLS)(它应该叫做PLS回归(PLSR),但这个术语很少使用)。我参加了第一届国际漫反射会议(IDRC,通常称为“Chambersburg”)在1982年,我遇到了弗雷德·麦克卢尔教授介绍我使用傅里叶变换近红外光谱和我们做了一些工作在替换过程控制的近红外光谱数据与傅里叶系数半岛综合体育官方APP下载德甲3但没有进展这个工作因为我成为固定在另一种方法利用傅里叶系数(卡纳克)4在今年晚些时候——更多关于这个!

PCR被伊恩Cowe提升5这将首先讨论,因为它是更容易理解请PCR的变异。在PCR光谱数据进行主成分分析和主成分分析用于SMLR分数。PCA的关键优势是大大压缩数据,他们是正交的。通常是700近红外光谱波长变量可以被压缩到20个人电脑。PCA分数的事实是正交的,意味着它们不相关的共线性问题。Cowe的工作电脑被选为回归,通过相关的分析数据,但这都没有跟着其他工人。这意味着pc SMLR选择的适用性的订单,这是更容易决定何时终止分析。

请在表单中,我们使用它是由哈拉尔德Martens Svante荒原6原创作品的赫尔曼·荒原7在计量经济学和社会科学问题,适用于化学计量学的问题被解决。请最容易被理解为修改PCR。像PCR,请计算新变量(PLS)总是叫因素原始数据但有不同的标准。请使用数据的方差也考虑了相关的数据,我们想要预测分析值。从广义上讲,高目标是最大限度地增加R2,它可以很容易产生过度学习。在PCR pc形成通过最大化减少方差(V),请在新的因素选择最大化的产物VR2。汤姆了MATLAB图形,操作员可以使用模拟这些操作。模型与一些随机数据x1,x2y。随机x数据被绘制在图的左边,投射在一架飞机提供的值z这些数据,对于每个点绘制在右边的图y值。当飞机旋转操作符的值z变化,这是一直持续到一个最大值的三个标准,R2,VV×R2。这三个最大值的照片如图2所示。

(一)价值高,0.994,实现了R2当旋转到最大化,但这个跌至0.698 (b)最大化V。值略高R2获得(c)什么时候V×R2是最大化。0.994为什么不是正确的答案吗?当然是图,但如果数据点被替换成新值0.99这个值可能会大大降低,这是真实的数据。只图模拟的计算第一个PC PCR和第一个因素请提供的可能性与良好的预测性能和高校准R2可以被发现。

“有什么意义?”

为什么我劳动这个话题?我认为请应该放弃了吗?不,我宁愿PCR已经选择的方法,因为我认为这是更容易理解,但请软件是如此优越的发展这是不会发生的。正确使用请,我们演示了一些过去的问题,比运行高。但是,我想让用户知道请高钙的发展而不是一个完全不同的“神奇”算法。我的建议是,人们进入这个区域应该遵循本课程从高到PCR请。

确认

我非常感谢汤姆·费恩看来MATLAB GUI如图2所示,他的工作,过去34年的建议和鼓励。

引用

  1. A.M.C.戴维斯M.G.哇和pw,培养“彩色图形显示系统援助”的选择产生最佳“波长近红外数据的回归分析”,实验室实践。33 (5),78 - 80 (1984)。
  2. A.M.C.戴维斯和t•费恩“这样做更快和更聪明(矩阵代数课6)”,Spectrosc。bdapp官方下载安卓版欧洲14 (6),24 (2002)。https://www.半岛综合体育官方APP下bdapp官方下载安卓版载德甲spectroscopyeurope.com/td-column/doing-it-faster-and-smarter-lesson-6-matrix-algebra
  3. A.M.C.戴维斯和W.F.麦克卢尔,”傅里叶近红外分析领域有特殊过程控制”,Anal.Proc。321 (1985)。doi:http://dx.doi.org/10.1039/ap9852200321
  4. A.M.C.戴维斯和t•费恩”通过近红外定量分析数据库:对比分析使用重组近红外和组成data-deux (CARNAC-D)”,j .近红外Spectrosc。14 (6),403 - 411 (2006)。doi:http://dx.doi.org/10.1255/jnirs.712
  5. Cowe主义者和J.W. McNicol使用近红外光谱的主成分分析”,达成。Spectrosc。257 (1985)。doi:http://dx.doi.org/10.1366/0003702854248944
  6. 美国荒原,h·马顿斯和h的山地,“化学的多元校正问题解决的请法”,Proc。相依矩阵铅笔1982年3月,在数学课堂讲稿Ed孩子和b Ka˙gstrom。施普林格-,海德堡,第286页(1983)。
  7. h .荒原“软造型:基本设计和一些扩展”,系统进行间接观察,Causality-Structure预测,Ed的kg。Joreskog和h的山地。北荷兰,阿姆斯特丹(1981)。
本文率
没有票
Baidu
map