半岛综合体育官方APP下载德甲自1975年以来光谱学
瑞士万通广告

不确定性在PLS回归测试

A.M.C.戴维斯

诺里奇近红外咨询公司75年Intwood路,Cringleford,诺维奇,NR4 6 aa,英国

偏最小二乘(PLS)是赫尔曼荒原在1970年代发明的1然后修改他的儿子Svante哈拉尔德马顿斯在1980年代早期2用于回归。然而,那些已经阅读这些列或一般的化学计量学的兴趣就会知道,这个名字最密切相关的偏最小二乘(PLS)(回归)哈拉尔德马顿斯”。请当然是广泛使用的近红外光谱和最优化社区但是哈拉尔德已经激怒了多年的统计社区不愿接受它。请的批评之一是缺乏意义的统计理论建立测试模型的参数。哈拉尔德和他的妻子去年马尼出版3一个非常聪明的方式实现不仅测试(Frank Westad)使用它作为一个方法的选择这些变量应该保留在请regession。4、5我能展示给你的过程已经列入辨音器的最新版本(7.6)®从这种软件包。方法首次被称为“Jacknife”,但这个术语已经使用在统计这可能是更好地称之为“不确定性测试”。这是背面所使用的名称。

不确定性测试

我们经常使用交叉验证6请发展的方法来确定应该保留的许多因素。原来的程序编写时,计算机内存溢价,所以只有中间结果,被要求后可以保留。现在,我们通常是丰富的存储空间,所以我们可以保留尽可能多的中间计算。当我们做交叉验证的原始程序不保留所有回归系数的估计,但马顿斯意识到,如果你做了,那么你可以使用它们来估计的方差系数,因此测试如果他们明显不同于零。一旦你测试你可以继续用它来决定应该从哪个变量原始数据集。

一个演示

我继续使用这种辛烷数据集7主要是因为我可以参考以前的文章,8、9希望你会记得!它不应该是一个理想的设置对于这样一个示范。26集包含一个训练集和测试集的13个样品226近红外波长的测量与辛烷值测量参考化学。

我最后一次使用后我的数据显示,我们已经取消了两个偏远样品我们可以开发一个PLS回归了RMSEP0.41。另一个可能的校准基于101年第一个变量在测试集上表现不好,给一个RMSEP0.88。

图1显示了模型的标定块使用所有变量但省略两个离群值。这使用完整的交叉验证(即每个样本被排除,一个模型进行了计算,并用来预测样本)但我也自责新的“不确定性测试”框。图2显示了重要的变量的回归系数显著。这表明两个地区的数据与显著的系数。从之前的研究中9我们知道的第二个方面是相关的异常值,所以这将是一个好主意使用第一个区域。图3显示的结果建立一个新的模型减少组40变量。我这是一个新的模型包括所有数据,得分和情节(左上)并不表明任何严重异常值的存在,所以我们可以使用所有26个样本在训练集,当测试了13个样品在测试集,该模型给出了一个RMSEP0.33这似乎是一种进步,但我们还没有完成。我再次勾选的“不确定性测试”的盒子,这样我们可以看到如果减少所有的变量产生显著的系数。情节,图4中,显示只有十八岁很重要所以我们再一轮循环,与这些十八变量计算模型;结果如图5所示。该模型给出了一个RMSEP0.31的测试集上,图6。这个结果不太可能显著不同于40变量模型但是如果它已经相当大数据集的测试将是首选,因为模型包含更少的条件。

图1所示。校准226辛烷使用近红外光谱变量。顺时针方向从左上角:前两个因素得分图;回归系数与波长;预测与参考校准设置;剩余验证方差对许多因素(个人电脑背面的术语)。

图2。回归显著回归系数如图1所示。

图3。校准辛烷使用40近红外光谱变量。图如图1所示。

图4。回归显著回归系数如图3所示。

图5。校准辛烷使用18近红外光谱变量。图如图1所示。

图6。情节的预测参考使用校准的测试集如图5所示。

有一些额外的好处,来自不确定性测试,其中一个是如图7所示。这表明因子得分的变化每个迭代中每个样本的交叉验证。每个中心的“明星”是最终的模型,而每次迭代的结果显示为一个交叉线的中心。圆圈表示计算得分时,样本请计算。如果它是远离中心(样本26)那么它表明它是一个样本具有较高的影响力。

图7。稳定第一两个因素得分图校准如图5所示。

不确定性测试是一个“双赢”的发展请。哈拉尔德不仅能够提供一个重要的检验回归系数的测试为我们提供了一个简单的方法减少不必要的变量,这应该引起更健壮的模型,在不同的光谱仪也更容易转移。Westad和马顿斯表明,它不是很难自动化过程,所以在未来我认为我们将看到请校准,利用相对较少的变量成为常态。

谁有兴趣了解底层数据应该读的描述“Jacknife”汤姆·费恩看来。10

引用

  1. h .荒原“软造型的潜变量:偏最小二乘方法”,观点在概率和统计,由j . Gani Ed。学术出版社,伦敦(1975)。
  2. 美国荒原,h·马顿斯和h .荒原《会议矩阵铅笔,1982年3月。数学课堂讲稿,埃德·a .孩子们和b . Kagstrom。施普林格-海德堡,第293 - 286页(1983)。https://doi.org/10.1007/BFb0062108
  3. h·马顿斯和m·马顿斯食品质量和偏好10日,233 (2000)。https://doi.org/10.1016/s0950 - 3293 (99) 00024 - 5
  4. f . Westad m . Bystrom和h·马顿斯近红外光谱学:第九届国际研讨半岛综合体育官方APP下载德甲会论文集,由A.M.C.戴维斯和r . Giangiacomo Ed。近红外光谱出版物,奇切斯特,第251 - 247页(2000)。https://www.impopen.com/fbooks - toc/978 - 1 - 906715 - 21 - 2
  5. f . Westad和h Martensj .近红外Spectrosc。8日,117 (2000)。https://doi.org/10.1255/jnirs.271
  6. A.M.C.戴维斯半岛综合体育官方APP下载德甲光谱学欧洲bdapp官方下载安卓版10 (2),24 (1998)。
  7. 可以从这种网站:www.camo.no
  8. A.M.C.戴维斯半岛综合体育官方APP下载德甲光谱学欧洲bdapp官方下载安卓版10 (4),28 (1998)。
  9. A.M.C.戴维斯半岛综合体育官方APP下载德甲光谱学欧洲bdapp官方下载安卓版10 (6),20 (1998)。
  10. t•费恩近红外光谱的新闻11 (5),7 (2000)。https://doi.org/10.1255/nirn.580
本文率
没有票
Baidu
map