半岛综合体育官方APP下载德甲自1975年以来光谱学
瑞士万通广告

变量选择回归分析:一个更新一个老问题

A.M.C.戴维斯一个和汤姆·费恩看来b

一个诺里奇近红外咨询公司10白杨,Cringleford,诺维奇NR4 6 ua,英国。电子邮件:(电子邮件保护)
b部门统计科学,伦敦大学学院,英国伦敦WC1E 6 bt,高尔街。电子邮件:(电子邮件保护)

介绍

当我们开始使用回归分析(大约35年前!),多元线性回归(高)是最复杂的方法。当时我们没有许多变量(TD处理色谱数据,而特遣部队正在调查饼干)。“t测试”可以用来决定哪些变量应该加以利用。我们都成为参与近红外(NIR)数据和保持。起初我们都已经从简单的数据与6-19过滤器和过滤工具可能继续t。然后商业近红外光栅光谱仪变得可用,我们有700个变量!生活变得更加困难!

最早的两个解决方案是主成分回归(PCR)和偏最小二乘回归(PLS);这些类似的方法使用的所有变量,形成一个小数量的新变量(因素)的决定有多少或使用哪个变量是很好地回避。很少有选择这些方法的性能,但商业请软件开发更快,这是请的主要因素成为选择的方法。这花了很长时间,请和PCR首次证明了在近红外光谱应用程序到1970年代末,但请直到1990年代才获得其主导地位。几组曾在1975 - 1990年期间的变量选择问题。我们可以填满一个页面引用!然而,在我们的书1我们给的细节,很多方法寻找“最好”的子集,使用傅里叶和小波变换的人工神经网络(ann)和通用算法(GA)。

目前许多校准请开发人员满意,目前有成功应用的历史,它被视为一个“肯定”。一些开发商可能意识到研究人员不作为请故事的结局,但研究人员有时间去思考这些问题。开发人员的薪水得到可靠的结果,对于大多数数据集不能使用请相当批评。

请认为问题在于,它使用的所有变量在每个因素。在任何给定的校准的一些变量可能是非常重要的一个因素而不是其他人,但是所有都包含在每一个因素。一个变量对预测结果的影响的大小取决于系数计算请。如果系数非常小,那么它将会对结果的影响很小,除了每一个变量将添加一个小的噪声分量。因此请校准产生的预测必须超过最低的噪声。如果可以包含变量请只有当他们做出了有益的贡献,预测结果的精度那么一些噪声可以被排除在外。最近的一篇论文近红外光谱学杂志》上半岛综合体育官方APP下载德甲(JNIRS)2最近的一些技术相比的变量选择,请为基准。其中之一,动力部分最小二乘(ppl),3给更好的结果在三个不同的数据集与其他方法相比。

动力部分最小二乘法

动力部分最小二乘(ppl)是一个修改NIPALS算法,这是最早的许多算法,现在存在的请修改问题。装运重量的计算,确定原始变量的贡献,每一个因素。这些装载重量标准算法与因变量之间的协方差成正比y和预测。ppl相关性提供了更多的重量,用额外的调优参数来控制这个重量。对于这个调优参数的值接近1,效果是驱动加载重量的许多变量为零,有效地使这些变量被消除。强的变量将幸存下来的(简单)的相关性y

实验

论文发表的数据用于脂肪在动物饲料,玉米纤维和蛋白质在不同的数据库中。光谱预处理是利用标准正态变量(SNV)方法。4额外的ppl参数被设置为自动优化范围在0.99 - -1.0。校准的每个组成部分而获得不同的校准样品的数量从20到200。结果,R2和选择的样本数量,绘制在图1 - 3。这些显然证明ppl程序的优越性标准请这些特定的例子当可用的数量校准样品低或中度。

图4 - 6显示哪些变量在19迭代选择越来越多的校准样品。这些选择比较的平均光谱数据库在使用。知识的选择很容易解释的近红外光谱吸收的官能团的不同分析物使添加对选择过程的信心。

这种改进的一个例子如图7所示,它显示了脂肪在动物饲料中的改进获得的校准与60个样品用于校准。请给一个R2值为0.78 2521年预测的动物饲料样品;虽然ppl给值为0.93。

结论

最近红外光谱校准开始与一个相当小的数据库分析样本,所以ppl似乎是一种非常有用的扩展请。我将会感到惊讶(失望),如果我们不找到它在商业软件在不久的将来。这将是一个向我们的朋友和同事,托马斯法甲,不幸去世早,不久之后的出版JNIRS纸。

这是结束的寻找最终的变量选择方法?这是不太可能!

引用

  1. t . Næs伊萨克松t, t·费恩看来,t·戴维斯,一个用户友好的多元校正和分类指南近红外光谱出版物,奇切斯特,第十章(2002)。http://www.impublications.com/shop/a-user-friendly-guide-to-multivariate-calibration-and-classification.html
  2. S.I.Øvergaard, J.A.费尔南德斯,诉Baeten, p .达和t .法甲,“预测误差的改进使用变量选择在小校准设置一个比较最近的一些方法”,j .近红外Spectrosc。329 (2012)。doi:10.1255 / jnirs.996
  3. 美国Indahl”扭偏最小二乘回归”,j . Chemometr。19日,32 (2005)。doi:10.1002 / cem.904
  4. A.M.C.戴维斯和t•费恩“回到基础:最后的校准”,半岛综合体育官方APP下载德甲光谱学欧洲bdapp官方下载安卓版19 (6),24 (2007)。链接:http://bit.ly/WwSUhN
本文率
没有票
Baidu
map