半岛综合体育官方APP下载德甲自1975年以来光谱学
瑞士万通广告
越南—广告

对多元校正采样光谱分析:后果

金正日h . Esbensen一个和布拉德斯沃布里克b

一个顾问,独立研究员,博士(h.c。)www.kheconsult.com。电子邮件:(电子邮件保护)
bQBD咨询公司www.qbd-consultancy.com

本专栏的另一个标题可能是:“在一个分析基准是什么?“分析结果,与他们多变量最优化模型,不能孤立地进行验证;分析结果有一个背景,历史,影响质量的决心一样的技术分析方法在事实上,往往更是如此。相关的问题是representativity对主要目标材料,很多。分析整除,或直接分析信号,是一个复合的产物“lot-to-analysis”通道中所有前采样/信号采集操作必须代表为了分析结果(数据最优化世界)有效再现原来的很多材料。业者所取样,样品制备和样品表示错误,共同构成总抽样误差(谢霆锋合计),通常是汽车销售+倍孤独(TAE光谱测量错误规范),也就是说,谢霆锋合计主导总的测量不确定性的预算。仅关注分析(TAE规范),因此,违反了尽职调查时看到的观点用户分析结果,形成了关键决策的基础科学,技术和产业。本专栏为所有关键步骤调查适当的上下文之前光谱分析及其对多元建模光谱信号的影响,而不管东京证交所合计贡献很大,中间或小。处理所有情况下必须是完全相同的,包括传感器解决方案的过程分析技术(PAT)领域。

介绍

“采样”的关键问题是材料和很多非均质性以及如何抵消其不利影响采样/信号采集,业者和样品制备/演示过程,所有这些明显发生之前分析。抽样理论(TOS)是荟萃分析的光谱模式的指导框架。TOS强调基本抽样原则(FSP),即所有潜在的单位从一个原始材料必须有一个相同的概率被采样在实践中,这样品取样后不以任何方式改变。单位可以是粒子,粒子碎片或collections-of-units实际抽样单位,称为增量。在定量光谱分析领域,遵守FSP相当通常隐藏的大象在房间里;远离总是正确的承认。在这种情况下,存在很多潜在的缺陷就在实验室分析和过程分析技术(PAT)应用程序,必须被避免,以免不必要的总抽样误差(谢霆锋合计)生产。这些错误会控制不住地膨胀总Sampling-and-Measurement不确定性(SMU)。

目前列集中在可能出现的不良影响在最优化数据建模生产“另一边”的分析结果,如果不注意基本representativity服务条款的要求。TOS只需要最低限度的表示这一列。

抽样理论,服务条款

FSP是第一个六个管理原则(GP)和四个采样单元操作(锁),必须尊敬representativity为了保证取样和分析。在以前的半岛综合体育官方APP下载德甲光谱学欧洲bdapp官方下载安卓版列和最优化和光谱社区内(特别是近红外光谱领域),同意条款提出了广泛的任何深度,作为一个统一的、系统的框架之前所有原则和实际操作需要分析。虽然通常认为分析师只是TAE负责规范,别人必须负责控制谢霆锋合计。然而,这是一个最不幸的部门,积极邀请一个严重的疏忽罪:谁是真正负责保证representativity分析结果,如果/当大部分的不确定性产生自满的分析实验室的四面墙外?我们认为最好是查看“lot-to-analysis”途径作为一个统一的整体,共同责任,包括任何光谱的定量分析(形态)以及数据分析师,是否最优化统计倾向。

这一列是一个合理的要求整体的抽样、分析和数据建模为一个整体。相关的文献众多,并提出必要的最低TOS能力是科学,技术和管理负责保证相关的,有意义的和可靠的分析结果为多元校正模型在所有情况下,在任何情况下,对所有类型的材料,可以进行光谱分析。综合核心参考列表是一个所有的需要。1 - 8

参考1是一个专著回答这个问题:“为什么我们需要抽样理论(TOS)”。参考2是最新的服务条款,并参考3是特别相关的定量光谱分析。引用4是事实上的国际标准的一般原则代表抽样,通常伴随着参考5完全覆盖的服务条款和测量之间的关系的不确定性(μ)。参考6向读者介绍关键过程的技术服务条款和帕特之间的相互作用。参考7是最近的最优化教科书,关键pre-sampling领域完全集成,包括其轴承在适当的模型验证(问题不是由任何其他最优化教科书)。参考8是一个功能一阶相关问题的应用在线近红外光谱预测药物粉末组成,作为一个例子的研究后,整体的电话。这一列占用这范围,特别是处理最优化社区的服务条款不遵守的后果,通常被认为是神圣的实体的“数据”,没有人多关心pre-analytical域:“Chemometricians分析和模型data-basta !”

只需要两个TOS元素现在目的:

基本的抽样原则(FSP):“帕特TOS-the缺失的一环”,6放大通过引用8,解释物理提取之间的区别样品(代表)或标本(非代表性)相对于TOS-compliant光谱与物质流的交互(代表“帕特过程抽样”),以及这种差异的结果未能遵守FSP应用于流水的问题(所有更充分地解释下)。

抽样偏差:未能消除不正确的补充采样错误(伊势),全部或部分,将不可避免地导致抽样偏差,未知的大小,不能纠正了许多这一列的引用。它将会出现在帕特的方法主要有几个陷阱如果/当相关的服务条款原则不注意(或可能是未知的)。

从中

为了最优化多元校准/验证/预测,我们首先感兴趣的关系:

“From-lot-to-aliquot”(采样+分析,即传统物理抽样),和

(抽样通过“From-lot-to-spectrum”在- - - - - -在线应用光谱分析,帕特)

传统域采样+分析只需要很少发表评论。从专业的角度分析实验室,样品到达实验室,聘请产生请求的分析结果。最好是代表样本,当然,但它并不神秘为什么许多专业实验室宣布相关性、有效性,质量和representativity地位主要样品是完全的责任客户供应他们,因为这一天方便节省w.r.t.决策的基础上,分析结果。毫不奇怪,我们看到在许多情况下,结果由质量控制(QC)实验室是理解为绝对真理。显然有很好的理由,分析样品交付的代表,但这意味着它是否代表所有问题的全部提取已经消失了。质量控制和生产之间的划分是没有比这种情况更明显。

但它公平地说,这些关键的系统论问题也开始出现在议程,至少在一些实验室:“我们知道潜在的总抽样错误,这很可能危及客户的目的。我们告诉他,还是不呢?”(非常)更多的讨论关于客户之间的复杂关系,在这种情况下生产和实验室,这是最近受到广泛分析抽样早些时候列。9、10

——在线领域(分析抽样)是当前列特别感兴趣的。历史上有一个趋势在PAC(过程分析化学)和帕特考虑安装帕特传感器为管道的代名词:“没有获得直接采样needed-spectra”,但这是一个错误的最高订单!参考6是第一个集中处理什么是抽样二元性,图1所示。

图1所示。基本抽样二元性。物理或光学抓取采样产生相同的抽样误差的影响(伊势,CSE)。说明版权KHE咨询、复制与许可。

这个“没有抽样”谬论乐观所示展示“直接”帕特传感器的应用消除发生大规模的伊势,图2和图3所示。

图2。“帕特传感器应用程序解决所有抽样问题”谬论,此前因为帕特传感器不是“看到”一个体积对应于一个完整的横断面片移动的物质流,参见图3。说明版权KHE咨询和马丁•Lischka复制与许可。

图3。巨大的伊势的结果不符合服务条款的原则。这个数字还可以理解为看着移动的传送带,或代表一个纵向截面管道中的流管道。“TOS-correct”描述和提取横断面增量,或切片流卷,灰色在顶部面板所示。所有其他增量产生一个重要抽样偏差表示。说明版权KHE咨询和马丁•Lischka复制与许可。

似乎很难理解为什么这种谬论的起源,以及为什么它被传播在至少两年在帕特领域。严格的事实是,只有完整的片流物质合格的适当的体积或质量支持代表增量/信号。一个

一个目前列提出了严格的要求,代表增量提取/信号采集。读者将意识到,经常有严重的实际困难时遵守此,例如有效的近红外光谱的路径长度~ 30毫米,而有效的管道直径可以更大(更大的),说100毫米或更多?“巧妙”反射探头可以实现一个特定的方式来弥补这一缺口,但本质上是由同一路径长度相等的最大值。旁路管将迅速成为重要的利益a.o。提出的问题在当前列的形式将解决方案在本系列的下一列。

上面的直接导致一个根本的区别在这种情况下:

  1. 一个样本细胞(示例:名词),
  2. 一个抽样抽样:细胞…(动词)

仔细想想,这里的行为同时取样和分析,区分抽样的效率,在某种意义上可能表现为使抽样多余的(物理)。但后者极度依赖代表性抽样,但书的压倒性的重要性。如果抽样代表各种各样的未知,变化无常的抽样偏差仍将是等式的一部分,完全摧毁了“没有抽样”的说法。另一方面,如果/当取样和分析细胞符合TOS representativity需求,条件适合收获PAT革命的强大的优势,但只有这样。详细参考6对待这些问题。

粗略的调查相关工业过程技术和专用的帕特文学从过去10年左右不留下深刻印象。不知情的忽视“切片”格言可以找到丰富的(但也有满意的时刻)。这里的任务是确定哪个是哪个,但是只有直接关注的关键需要一定的最低服务条款的能力在帕特领域。

适当的应用程序服务条款的相关医生和锁在系统论领域是为了一个强制性的要求保证样本,或光谱收购从物质流,可以证明是代表。未能达到这一需求将导致妥协分析样品/信号来开始后续的最优化数据分析或建模。

作为一个杰出的当代的例子,考虑连续性生产的迅速扩张的情况下(CM)在制药工业部门。图5显示了许多地方在CM通路NIR光谱描述找到很好的使用。图5还显示,人们可能会很容易迷路没有一点点TOS能力参与设计、实现、验证和运行阶段的启动使用这种生产方法。

虽然经常似乎是相对容易获得“直接光谱数据”通过插入PAT传感器,图4和图5所示(x数据回归),不过这些都是批判性的依赖上述伊势问题是否已经成功地消除,或不是。未能遵守这一要求是迄今为止最经常会见了一个好战的最优化社区内缺乏;文学充满了说明性的例子,但是我们应当避免识别期刊、论文、作者的任务是声音警告继续不知道(或故意忽视)的关键支持卷格言。幸运的是,很多工作已经由CM系统的先驱解决这些抽样问题,事实是,CM系统本质上降低了传统3 d抽样计划利用一维抽样(传统方法制造)情况。这是最优,TOS-correct理解的开始寻找解决采样问题警告。

图4。概述安装许多可能性的“样本提取阀”和“帕特传感器”传统工艺产业。注意所有配置所示将导致错误,即偏向样本或光谱信号至于representativity因为他们支持卷不对应完整的流片。参考6把这些过程抽样问题深度w.r.t.强调解决问题。说明版权KHE咨询、复制与许可。

图5。四个过程分析位置参与厘米,基于串联sampling-and-NIR光谱预测药品API组成,防潮、PSD、混合均匀。除了伊势卷与不正确的支持,这将影响多元校正的光谱x数据的质量,还有同样重要的问题相应的质量数据,参考样本的代表必须获得。但究竟如何,这些应该提取吗?这是一个经典样本提取问题,远非总是正确地承认和更令人满意地解决,主要是因为TOS仍然是部分(主要)小承认过程技术的关键成功因素,光谱和化学计量学。半岛综合体育官方APP下载德甲说明版权QbD咨询公司与许可转载。

此外,为了执行适当的多元校准的一个或多个y变量,需要提取相关、有效和具有代表性的参考样本(y数据回归)。事实上,这也适用于适当的用于测试集样本验证所需的多元校正模型来进行在线预测(实时成分变异)的混合千篇一律,水分,PSD…。7记录设施为代表的收购这两个传感器信号(X-spectra)和参考样本(参考数据)必须在场,或多元校准/验证预测模型将永远继续遭受“减少”不可能预测错误等。这些问题常常被描述在可疑的阴暗的时尚文学;一是试图解释这个,好像作者确实理解伊势的基本问题,但在一个完整的损失提出的解决方案的工作。事实上,“扫地毯”下的问题导致许多过程故障调查和“难以理解的结果”,这实际上是救火,仅仅只是没有在第一时间。

许多技能

这个专栏的目的介绍不同学科的所有元素我)服务条款,ii)过程工程、iii)光谱分析,(四)传感器技术,v)帕特和vi)最优化数据分析。都需要承认,属于非均匀材料的分析结果和系统有一个历史某种程度的抽样(一级、二级、三级b)是永远存在的。c这个根本原因”在一个分析基准是什么?“总是包括误差影响的一个重要补充和不确定性源于这个系统论领域(更小或更大,但从未缺席)。关键是,这种状况必须承认,分析师和数据分析师;这一点已经在参考强烈反驳5。它不再是适当的把责任转嫁给别人。如果帕特将是实现成功的组织,所有参与质量、生产、管理事务,以及管理,必须在同一页。

b即业者/分成几个阶段;这些都是善意的抽样过程本身。

c例外,例如统一材料,德啤酒稀释等不能解决更复杂的问题建立一个基础周围明显的异质材料处理。

最优化数据建模

“破坏样品或信号”——什么感觉?妥协,因为提取实物样品或收购的光谱信号将被关联到一个重要抽样偏差。抽样偏差的本质是,它不能纠正,分析或统计数据,作为分析不同于偏见,可以进行一个统计偏差纠正。也许令人惊讶,这区别对待在完整的引用2 - 7日。

这种最优化的数据分析和建模的效果就像房间里的大象,通常被忽视。简单地说,没有数据分析的方式,数据建模等最优化和统计领域能够正确抽样偏差;参见参考文献6和7的充分理由为什么这是不可能的;也参见图6。

什么是对多元数据分析的具体影响,造型和校准?

第一:将会有一个膨胀的总μ与每一个相关分析结果,通常明显大于本身(具体分析错误可能当然偶尔也重要,但只有结果的分析方法不适当的控制;这样的问题最终会得到控制,GLP a.o)。

第二:在那里多元数据错误的一个组成部分,所以有效地筛选了强大的双线性数据建模方法在化学计量学,必须考虑在适当的时候。图7显示了主要说明最优化分解多元数据到系统的数据结构(主要任务和PLS-components)和分离多元数据错误(es在最优化的说法)。

图7。最优化双线性数据模型的数据结构,主成分分析或PLS-components(原理示意图)。多元数据模型错误(es)通常是乐观地认为“TOS-errors”(谢霆锋合计+ TAE),但他们不是,看到文本澄清。

化学计量学中的默契,叠层错误(es)将会包括TOS-errors源于抽样不足,在这种情况下,它会有可能纠正伊势。事实上,多元数据分析将出现在科学里不可思议的力量,即使是已知或预见在化学计量学的起源和发展。唉,这不是如此!

抽样偏差的影响总采样+分析通货膨胀不确定性级别是这样两个数据分析组件以及它们的互补错误(es)受到变化无常的偏见的影响效果。因为TOS-errors表达单一变量,每个变量偏差会影响不同。悬而未决的sum-effect抽样偏差是谢霆锋合计不同每次尝试新的分析确定一个新的样本。这意味着每一个新的样本添加到一个已经存在的数据矩阵,想到一个训练数据集,将每个添加自己的不同贡献数据方差和总也因此总协方差数据集。因此,组件和错误都将受到影响。这些问题更详细地描述参考7。

完成,补正确的采样误差(CSE)也会影响每个变量,在消除或最大减少伊势。

影响化学计量学

因为有很多有影响力的代理商参与对于每个样本中提取,或为每个信号收购帕特乐器,它很可能是一个无用的简单化理解所有“数据”作为变量,但相同的实现。每一个都有系统的信息内容,增加了随机误差补。在化学计量学前可以通过数据分析成功地模仿“组件”,后者可以很方便地确定、量化以及排放,这是“需要知道”如果数据总是,根据事实本身,代表和可靠。然而,这并非如此!

本专栏认为,每个个体的背景数据,收集和分析数据的矩阵必须欣赏更充分地开发环境中,传统的“测量误差”的重要部分也包含贡献,经常大贡献,每个样本的具体历史、整除或光谱信号的支持。数据分析师必须考虑到这种错综复杂的关系,以免glib,简单的解释“测量误差”将运行一个严重不反映出的风险更为复杂的现实。

这些关系的典型的表现是如图8所示,这突显出一个事实,即任何最优化预测模型缺乏足够的性能下降,例如就是明证RMSEP“过高”验证,可以只有被关心改进东京证交所产生对所有数据,严格基于完整的理解误差补绝大多数是由东京证交所的贡献合计

因此,它不是一个保证成功的策略,只关心“数据”,优化数据分析建模的目标分类学(最优化组件),也许承认一个小的意外除了分析错误。因此,这将包括因未被发现的主要决定因素,或故意忽略,抽样错误及其产生的不确定性。解释标准regression-prediction figures-of-merit,例如RMSEP验证必须基于少量TOS知识和能力才能改善“精确”不能令人满意地预测性能统计数据。在我们的许多数据分析师跳过直接到集体经验R2合身的回归线的价值好像这是某种形式的神奇事实统计数据,但是它只与模型拟合。

这是最相关的标准评价:最优的双线性模型,RMSEP应该统计上的错误类似的参考化学错误,这种情况下应该达到一个相对较小的模型组件。随机的隐式造型文物在克服材料的光谱数据的异质性和非代表性取样只有与小测试卷。如果需要大量的模型组件来实现你的错误目标(如果这是可能的话),这只是造型海市蜃楼。如果一个最优化模型不能低于你先天的建立RMSEP误差阈值,它告诉你有一个基本的问题的分析领域。

这是真正的信息- - -再多的呼吁“样本”,多光谱(平均),模型组件将以往任何时候都更有帮助。不愉快的情况下,图8,仅仅意味着你必须专注于提高你的抽样方式。TOS脱颖而出!

图8。理论抽样(TOS)——帕特和化学计量学中缺失的一环。谢霆锋的关键效应所示问题解耦合计成的贡献主要抽样错误(PSE),二、三级抽样(SSE,谢霆锋)和分析误差砂岩(TAE)。较低的面板说明一个不满意RMSEP验证多变量预测模型表现的“预测与参考”情节。服务条款是唯一的方法,概述了解决方案,导致减少谢霆锋合计

结论

一个确定的方式能够减少不确定性元素背后的数据分析模型不符合预期的预测性能目标,是传统的呼吁更多的数据(一种方法经常引用的文献中,在实践中观察到)。更多的数据,这意味着更多的样本分析,总是显示相同的证交所合计特征的样本已经包含在当代的训练数据集,参见参考7。这种徒劳的电话听到的次数在实践中是压倒性的,通常是传给那些小帕特/化学计量学领域的经验,以避免透露更多难题。关注的根本原因。为什么样品和他们的分析结果与现实不匹配是一个简单的抽样问题,然而,必须作这样的处理。

事实上,大多数在帕特最初的努力实现和数据建模前应该专注于改善和优化抽方式分析和数据分析。俗话说:“如果数据已经包含信息,化学计量学会成功”。然而,如果数据被采样噪声淹没,甚至应用隐式或显式“校正功能”仍将不提高分析结果的准确性,因为这个错误永远无法模仿。

化学计量学不是一个黑盒,“按钮”的方法,模型会自动做其他!自动化学计量学例程在软件包应该取缔,从未用过!供应商提供软件怎么敢来代替主管chemometricians多年的经验在世界各地通过减少我们的集体实践一个自动程序!这种方法不工作的时候,同样的供应商告诉他们客户收集“样本”,以避免这个问题。化学计量学不是一个超市的模型,但科学技术领域所有的变异来源必须理解的模型是解释和validateable。

除非琐碎,意外TAE事故(总是特殊的情况,只有自己感兴趣的),减少不满意的唯一途径是通过减少证交所(TSE + TAE)水平合计。因此,只有方式可以减少“麻烦”,显然不可压缩不确定性贡献背后令人不满意的多元数据分析模型,图8,掌握必要的基础知识的服务条款。

Chemometrians并不免除这些科学的见解。不再有借口躲在“我不需要学习化学计量学,优越的软件会帮我”。像cgmp的21世纪,我们还需要一个21世纪整个sampling-analysis-data方法分析途径,否则我们将同样的快乐旅行绕,总是在追逐自己的尾巴,永远不会进步。

承诺

我们应当解决的许多问题在本专栏中指出的角度解决方案在本系列的下一列。

引用

  1. K.H. Esbensen和c·瓦格纳,“为什么我们需要抽样理论”,分析学家(10月21日),此前(2014)。
  2. R.C.A. Minnitt和K.H. Esbensen,”皮埃尔Gy抽样理论的发展:一项回顾性总结与说教的教程定量取样的一维”,TOS论坛7,7-19 (2017)。https://doi.org/10.1255/tosf.96
  3. K.H. Esbensen, R.J. Romanach和公元Roman-Ospino抽样理论(TOS):一个必要且充分的保证可靠的多元数据分析在医药制造业“,多变量分析在制药行业由美联社费雷拉Ed J.C.塞斯和m . Tobyn。学术出版社,Ch。4页53 - 91 (2018)。https://doi.org/10.1016/b978 - 0 - 12 - 811065 - 2.00005 - 9所示
  4. DS 3077,代表sampling-Horizontal标准。丹麦(2013)标准。http://www.ds.dk
  5. K.H. Esbensen和c·瓦格纳,”理论抽样(TOS)与测量的不确定性(μ)——要求集成”,趋势肛门。化学。(TrAC)57岁的93 - 106 (2014)。https://doi.org/10.1016/j.trac.2014.02.007
  6. K.H. Esbensen和p·莫特森”过程采样(采样理论,TOS)——失踪的链接过程分析技术(PAT)”,过程分析技术,2nd版,艾德·Bakeev。威利,页37 - 80 (2010)。https://doi.org/10.1002/9780470689592.ch3
  7. K.H. Esbensen b·斯沃布里克,多元数据分析-介绍多元数据分析,通过设计过程分析技术和质量。迷彩伪装(2018)。
  8. R.J. Romanach, r·门德斯和K.H. Esbensen”,抽样理论原则的应用实时监控药物粉末混合的近红外光谱”,半岛综合体育官方APP下载德甲Spectrosc。bdapp官方下载安卓版欧洲31 (5),月22 - 27日(2019年)。https://www.半岛综合体育官方APP下bdapp官方下载安卓版载德甲spectroscopyeurope.com/sampling/application-theory-sampling-principles-real-time-monitoring-pharmaceutical-powder-blends
  9. K.H. Esbensen”,两个实验室我的故事:挑战”,Spectrosc。bdapp官方下载安卓版欧洲30 (5),23-28 (2018)。https://www.半岛综合体育官方APP下bdapp官方下载安卓版载德甲spectroscopyeurope.com/sampling/tale-two-laboratories-i-challenge
  10. K.H. Esbensen”,两个实验室的故事2:决议”,Spectrosc。bdapp官方下载安卓版欧洲30 (6),23-28 (2018)。https://www.半岛综合体育官方APP下bdapp官方下载安卓版载德甲spectroscopyeurope.com/sampling/tale-two-laboratories-ii-resolution

作者

金正日h . Esbensen博士,博士(鸿),已经在地球科学数据分析和取样研究教授在三所大学(1990 - 2015),之后,他搬到被一个独立的研究人员和顾问:www.kheconsult.com。他是一名几个科学社会和同行评议的论文发表了超过260。加上布拉德斯沃布里克,他撰写了一个广泛使用的教科书的多元数据分析,出版于2018年(http://bit.ly/chemometrics)。他是一个国际皮埃尔Gy抽样协会创始人之一www.intsamp.org该杂志的编辑TOS论坛,impopen.com/tos-forum,这个抽样的列。

布拉德斯沃布里克是拥有高品质的设计咨询公司(www.qbd-consultancy.com)和联合创始人KAX集团(www.kaxgrp.com)。他是一个世界公认的专家在化学计量学的应用和实验设计方法过程分析技术(PAT)应用程序质量的设计(QbD)环境。

本文率
平均:5 (1投票)
Baidu
map