Rodolfo j . Romanach一个Aidalu Joubert卡斯特罗一个和金姆·h·Esbensenb
一个波多黎各大学化学系,马亚圭斯校区校园,波多黎各
b主人KHE咨询、哥本哈根、兼职教授,Aalborg大学(AAU),丹麦;兼职教授,来自丹麦和格陵兰岛地质调查的(GEUS);魁北克大学教授associe, Chicoutimi (UQAC),魁北克;挪威东南部大学客座教授(USN);客座教授Recinto de马亚圭斯校区大学波多黎各
DOI:https://doi.org/10.1255/sew.2021.a11
©2021年作者
发表在Creative Commons BY-NC-ND执照
这个专栏的目的是提供简单易懂的抽样错误的例子。是因为最近参与在线会议和会议上的演讲,我们认为需要一个更有意义的介绍和例证的概念和实际后果的“抽样误差”。什么是抽样误差?抽样误差的结果是什么?我们能做些什么抽样错误呢?这些都是欢迎主题的一系列采样列!起点将在抽样理论和近红外光谱分析和医药应用领域,但重点将更加发展半岛综合体育官方APP下载德甲一般,以便读者能够遗留到其他感兴趣的科学和应用领域。
简介:学生在分析化学了解抽样错误
是非常有益的开始抽样错误的主题是如何从的角度来看,最终的一切条件:分析。从分析化学的观点是什么?
在本科水平,学生被教导,有七个基本分析化学分析所涉及的步骤。这些是我)方法选择、ii)样本采集、iii)样品制备,iv)样本分析,v)的计算和vi)解释结果…和七世)的专业报告。第二步在这个被称为化学分析途径抽样。抽样是定义在一个经常采用分析化学书”的过程中收集一个小质量的材料的成分准确地代表了大部分的材料被取样。”1换句话说,整除分析在实验室必须有相同的成分作为散装材料的获得。一个指出,这里没有帮助如何获取具有代表性和代表分析整除。
学生被教导,所有测量分析的一个相关的错误,并为此“真正的”或“精确”价值永远无法获得。然而,随着知识的不同类型的误差来源,可以减少和估计误差影响的大小。尽管有许多来源的分析错误,它们通常可以分为三大类型:系统错误(或确定),随机总值(或不确定的)错误和错误。
系统误差
系统误差导致的一组分析数据不同于公认的价值,导致所有一系列的结果复制测量过高或过低。系统误差的存在会影响精度的分析。系统误差来源已知的,或至少从来源,可以识别,系统误差的大小可再生的测量从一个到另一个地方。系统误差可以分为三种类型,根据其来源:仪器误差,方法错误和人为误差。
Systematic-instrumental错误包括,例如,改变原来的校准,校准的变化由于温度的差异是为了和/或玻璃器皿墙本身的变化在干燥过程中烤箱。玻璃器皿的例子包括滴管、容量的玻璃瓶和滴管。这些例子说明,但并不详尽。
系统的方法错误将分析方法本身的局限性。反应和试剂都是这种类型的错误,即他们可能是由于一个不完整的反应和/或副反应。常见的例子是缺乏特异性或减少试剂的性能来执行其全部在反应中的作用。这是,例如,当未知样品分解失败发生由于试剂的反应。因此,在滴定的滴定剂需要产生颜色的变化指标等当点后就是一个例子,这种类型的错误。系统的方法检测并纠正错误是最困难,因为其校正需要改变一些,或分析方法本身的所有部分。
Systematic-personal错误例如,由于贫困关注重要或关键的方面分析上下文的分析师。这可能包括可怜的判断,粗心大意,甚至缺乏训练的分析师。分析偏差,即倾向于斜估计的方向,支持预期的结果,被认为是影响systematic-personal错误的分析。2
随机误差
在分析化学假定随机误差导致分析数据分散非常对称的平均值,这错误的概率相同是积极的还是消极的。随机误差的存在会影响精度的分析。随机误差的来源是由于不可控变量,因为无法确定他们的消息来源,他们不能完全消除。一块相对频率和平均偏差,为大量个人错误,被称为高斯曲线或正常的错误。高斯分布假设只存在随机误差的分析,即,所有系统已经发现并改正错误。这个关键的假设允许一个获得适当的统计处理分析数据,以促进评估这个误差的大小依次允许偏差纠正。
严重的错误
虽然不像随机或系统错误,常见的严重错误的特点是“大”,从而导致分析更高或远低于“真”值。总误差的来源通常被认为是人为错误;错误将会化作总值离群值在一系列的重复测量。
通过这些错误的报道一般分析课程,在有关分析化学实验室,需要高准确度和精密度不断强调在大学层次。然而,暴露在前面的抽样过程是最小的。学生通常提供了一个未知的样本,但几乎总是跳过前面的抽样步骤。
已经了解了抽样错误:到目前为止没有什么
在分析化学中,之前的分析域是方便“左”除非严重错误,绝对不等同于TOS-it中抽样错误的领域其他人照顾任何贡献有总采样+分析错误管理。传统上,这一责任落在实体负责抽样的形式或多或少受过训练的人员,区别是至关重要的。未经训练的人员,抽样错误并不存在,而正确TOS-trained人员非常清楚,从未经处理的采样误差总是膨胀的影响总分析误差预算(采样+分析误差预算)的一个或两个数量级的!忽略影响抽样误差就等于违反了尽职调查时看到的完整的“from-lot-to-aliquot”途径。
影响
一般,不是欣赏,既是一种偏见问题分析域内可以在完全控制,然而,和抽样偏差,不能以类似的方式处理分析的偏见。事实上,抽样偏差不能由任何被纠正后分析方法(数据分析、统计其他)。一个抽样偏差可以只有受明确消除所有所谓的“错误的抽样误差(ISE)”。伊势已经在各种治疗前一列,和专用的TOS文献中,将在这之后列被重提。但首先是什么,能做些什么抽样错误呢?
显然,一个人必须在TOS寻求庇护。虽然经常自称是复杂的,但服务条款可以实际上是可以从一个更深入的理论水平。例如,尽管TOS标识九抽样错误,他们来自只有三个来源:材料(这是总异构,只是程度的问题)取样设备(这可以促进代表提取、设计)和抽样过程本身(甚至正确地设计设备可用于非代表性的方式)。3
服务条款基础上抽样错误
首先,读者被称为引用4 - 6。建议这些是一起读,之前得到最好的基础,目前列是什么下面了。皮埃尔•Gy TOS的创始人,他的起点发展TOS的物质现象非均质性后来甚至开始解决这个明显的主要问题”如何样?“因此,Gy确认所有抽样错误代表的一切可能出错在抽样,业者(样本质量减少),样品制备和示例演示-由于异质性和/或劣质取样设备的设计和使用。他精心研究出如何避免犯这样的实际错误的设计、制造、维护和操作的采样设备和阐明他们的不良影响的总积累尽可能多的不确定性可以减少抽样时练习。当这一切都发展成连贯的服务条款,抽样误差的概念(SE)成为了关键因素,尽可能回答基本问题”如何样?“几乎成了同义词”我们如何消除和/或减少抽样误差对采样的性能的影响。能够识别抽样误差是90%的抽样代表。这些抽样错误也发生在过程分析技术(PAT)应用程序中讨论的深度在以前的出版物。7、8
一个关键的区别:错误和不确定性
两个问题构成一切关于“representativity”,第二个是跟抽样错误但紧密相连的,首先,一个相关的服务条款的基本前提。
的representativity地位不可能确定一个特定的样品或从任何可观测分析整除特性相关样本/整除本身。样品可以代表,或它可能是英里一个永远不会知道样品从它的起源。只有可以定义和文档,representativity的特征抽样过程。9一切都取决于采样设备,如何设计、使用和维护。这就是representativity可以退还。这是所有相关的抽样误差不适当的消除和/或减少,即如何能够识别和如何能够抵消抽样误差的影响在抽样过程中。这就是为什么抽样误差达到重点突出。人能状态,分析结果依赖在前面的采样和业者进行过程:只有真诚代表采样/业者进行过程导致代表分析整除(“收集的过程,一个小质量的材料的成分准确地代表了大部分的材料被取样”),而其他将离开整除影响重要抽样偏差……未知的大小(不能估计,因为它改变它的大小与每一个试图量化)。准确性w.r.t.主要样本中提取的原始材料将不能得到的。很明显,是非常关注抽样错误(“不正确”以及“正确”);更充分发展介绍读者被称为Esbensen的入门书。3这里,将关注说明第一组抽样误差的区别,将开始一个沿着一条路径,更深层次的理解。
有必要说外部清晰:一个至关重要的区别需要:不确定性和错误(Gy,10Pitard11)。
错误:区别一个观察或计算值和相应的“真实价值”;测量的变化(如分析结果),观察或计算由于错误或无法控制的因素。抽样错误不称为抽样的不确定性!
不确定性:缺乏有关某人或某事的踏实;东西不清楚毋庸置疑的;不是常数。没有一定数量的相关能力(TOS),可能第一个听统计学家,他喜欢这个词不确定性。
重复性研究往往在近红外(NIR)光谱,例如(参见下面的部分进一步),提供了一个估计的不确定性。半岛综合体育官方APP下载德甲方法的可重复性(短期精度)可能获得连续六次获得的光谱相同的样本。12标准差的预测提供了一种估计不确定性的预测。这种不确定性随机误差是不可避免的,它将永远是分析方法的一部分。
但是,皮埃尔Gy有以下说:“除了同质材料,只存在于理论中,颗粒材料的抽样总是一个偶然的(偶然,偶然发生,意外,意外)操作。总是有不确定性,不管多小,之间的真实的,未知的内容很多一个l而真正的未知样本的内容一个年代。词汇困难需要提到:传统建立了这个词错误作为惯例,尽管它意味着一个错误本可以避免,而统计学家喜欢这个词不确定性这意味着没有责任。然而,在实践中,演示了在服务条款,都是抽样误差和抽样的不确定性。抽样误差可以很容易地预防性的最小化,而抽样不确定性预先确定采样协议是不可避免的。为了简单起见,因为这个词不确定性不是足够强大,这个词错误被选为当前使用的服务条款,使它很清楚并不一定意味着一种责任。”
与这个错误定义,我们尤其关注所谓的是,IDE, IEE IPE和这个,见图1。他们将收到说明集中在本专栏。
IDE:增量描述错误
IEE:增量提取错误
这个:增加称量误差
IPE:增量准备错误
总体的了解伊势形式实际采样的支柱:如果是没有适当的消除/减少,抽样过程有偏见的。各种各样的不好的事情遵循从偏差抽样过程,最重要的是,随后的分析整除从来没有具有代表性的目标材料,即游戏失去了之前一个开始!分析一个整除的意义是什么,不能证明是代表?None-there是没有意义的!
第一部分对任何抽样议程,因此,充分消除/减少所有的伊势,为了能够这样做,必须知道如何正确识别抽样错误a.o。
抽样误差:它们是什么?
定义和完整的理论治疗所有的九SEs,读者被称为Gy的学术论文10或Pitard。11在这里,我们只简单地,说明这些定义和展示他们的影响在实践中…。3这些尤其容易欣赏过程中采样领域,参见图1。
图1所示。左:原型的例子增量描述错误(IDE)(也称为错误的描述错误)。唯一正确的服务条款规定(偏离)增量描述一个移动的材料是一个完整的across-stream片(例如在传送带)或一个完整的横断面卷(在一个移动的物质局限于管道,如在管道或类似)。其他IDE表现造成我)抓住抽样(顶面板),“只采取一些流的所有时间”(中心面板)和“不平衡的”切片(下半部分)也来装点一切有助于重要抽样偏差。右:现实世界的例子,一个高度不可接受的传送带“抽样”,导致一个非常重要的IDE,伴随着相应IEE,在IDE-affected片的深度不提取材料到传送带的底部。IDE和IEE经常坏的同行者对抽样偏差。说明版权由KHE咨询、复制与许可。
抽样误差制药公司的例子
的干燥制药配方提供了一个示例的抽样误差13在一个复杂的工业生产环境中,图2。
图2。固定探针的位置不一定总是正确的基础对于一个表现良好的分析方法,如近红外探测器安装接近底部的干燥设备。的相关性分析结果将随干燥制药混合物的成分演化。对分析物含水量(水分),隔离异质性将影响精度(将创建一个抽样偏差)对完整的混合体积,有关详细信息,请参阅文本。
随着干燥过程开始,混合料(w / w)含水量25%左右。然而,近红外光谱方法可能表示结果的54岁,31和27% (w / w),远高于预期的水平。图2提供了一个代表说明这种情况下最高的材料含水量位于接近底部的干燥装置,即接近近红外探测器的安装。结果越高的高异质性相关混合干燥阶段。图2 b说明了混合干燥过程接近尾声,剩下的水更均匀地分布在整个干燥容器的体积。相同的近红外光谱探测器安装现在提供更准确的结果,因为混合非常接近目标4% (w / w)含水量。体积/质量分析的近红外光谱仪现在更少的异构和分析调查的GSE减少抽样误差(GSE是“正确的抽样误差”,看到的,例如,参考3)。
药物的分布在平板电脑可能会导致类似heterogeneity-induced抽样误差。平板电脑可以制造过程中目标浓度为10% (w / w)。然而,平板电脑的顶部比底部有更多的药物的平板电脑。
图3提供了一个说明这种情况。漫反射近红外光谱方法在传感器辐射相互作用主要与顶部1毫米的平板电脑,例如,表明12% (w / w)的药物浓度。然而,当平板电脑是参考分析(高效液相色谱的方法,整个平板溶解和分析),药物浓度发现遵守的目标浓度10% (w / w)。这是一个经典的例子IDE-but执行的调查-结合异质性即使在最小的制药公司的兴趣,一个平板电脑的规模。因此,许多研究人员和工业监控工程师/技术人员更倾向于开发传输近红外光谱方法为平板电脑,覆盖整个平板电脑的体积,而不是漫反射率的方法。
图3。漫反射近红外光谱分析方法无法穿透,多说,1毫米的一个平板电脑,构成所谓可以探测增量描述错误;cf。图1为一个完整的切片,或一个完整的卷对信号采集的支持。
帕特分析师和chemometricians尤其是
一个支持失配误差(SME)是可能的,通常在开发校准模型帕特的应用程序。作为一个例子,拉曼光谱可以获得描述一个哺乳动物细胞培养在一个活跃的生物反应器,与客观的偏最小二乘(PLS)回归模型预测关键代谢物的浓度。14从一个示例是获得的拉曼光谱X块需要请造型。因此,这个应用程序需要提取样本的细胞培养生物反应器和使用它X拼收购以及参考分析离线代谢产物,后者将构成相关的Y数据。不用说,这样品最好是代表整个反应堆的体积(古典TOS的挑战)。大量中小企业将承诺如果拉曼光谱不获得相同的样本体积离线分析的参考方法,即如果支持卷X——Y拼收购并不相同,图4。
图4。关注最优化标定造型,可能会无意中导致犯了中小企业因为“样本1”,由拉曼光谱分析,不支持相同的样本体积所分析的参考方法“样本2”。半岛综合体育官方APP下载德甲
数据分析之间的相关性X和Y数据块将负面影响这样的中小企业,遗憾的是不能通过任何光谱pre-processing-or花哨的回归模型。15日16生物反应器通常的事实有力的混合,而拉曼光谱得到的贡献减少这种减少抽样误差的空间异质性的细胞培养基在整个反应器体积,但不能完全消除这种。混合和均化服务条款规定的抽样单元操作,应该用于减少抽样误差影响的异质性,3、16这当然应该是随心所欲地使用。但根本不匹配的物理分析卷(大众)的特点是两个不同的分析方法是一种结构条件,必须纠正为了能够减少相关的均方根误差预测最优化预测模型的应用。TOS洞察力帮助我们理解为什么重新设计的X,Y)数据采集设置有时可以低成本比随身携带一个是不必要的负荷。在伊势和同行(所谓的“正确的采样错误”,CSE)在未来抽样列。
讨论和结论
在干燥的例子中,近红外光谱法检测区域的混合水浓度很高的情况下,由于干燥过程是刚刚开始。如果样品分析的近红外光谱辐射可能会退出和分析了费歇尔滴定法(同一物理样品卷),分析结果将类似。然而,这两种结果不代表整个混合。样品分析不指一个完整的切片的干燥装置,更对整个干燥容器体积,但指体积小正前方的传感器探头,多余的水的体积。传感器实际上是进行调查抓取采样,经典的TOS错误。3如果分析师没有意识到高含水量的异质性是影响分析结果,大量的时间花在故障排除一种分析方法,事实上完全正确地工作。理解异质性如何影响抽样误差的表现形式,如果抽样错误不正确将接踵而至中和是非常有用的。本声明是必要的在分析领域。
近红外光谱方法轮也正确地决定了12% (w / w)药物浓度限制的顶部区域平板电脑分析。确实获得的光谱对应于这个浓度。问题不在于近红外光谱方法;问题是平板电脑的异质性。可以纠正的问题,例如,通过双方获取光谱的平板电脑,将整个平板检测药物浓度的差异。问题也可以纠正通过开发一个近红外透射法将分析大多数/所有的平板电脑质量,又包括双方的平板电脑。这个问题不需要修改最优化标定模型;它只需要修改平板电脑光谱采集设置,或可称为调查取样设置。
中小企业相关的生物反应器的例子也可以纠正。这个错误是由马克所讨论的,17并已全额解决最近拍暴露。7中小企业混乱实际上是在帕特领域最普遍的问题之一。这个问题不是通过任何光谱或解决最优化的方法,即通过试图找到不同的光谱区域的标定半岛综合体育官方APP下载德甲模型,通过改变光谱预处理或任何PLS-model中介,如在一个或两个额外PLS-components可以赔全部是完全徒劳的。中小企业是一个抽样误差、纯粹和简单,应该专门解决等;以后的专栏将进一步说明这些问题。
确认
作者感谢研究生Adriluz桑切斯Paternina准备数据。
引用
- 华盛顿特区哈里斯,定量化学分析,9th经济日报。w·h·弗里曼。纽约(2015)。
- D.A.斯,D.M.西方,F.J.叫喊和狭义相对论克劳奇,分析化学基础。纳尔逊教育(2013)。
- K.H. Esbensen,介绍抽样的理论和实践。小鬼,奇切斯特(2020)。https://doi.org/10.1255/978 - 1 - 906715 - 29 - 8
- k . Esbensen,”皮埃尔Gy(1924 - 2015):抽样误差的关键概念”,Spectrosc。bdapp官方下载安卓版欧洲30 (4),25 - 28 (2018)。https://doi.org/10.1255/sew.2018.a1
- K.H. Esbensen“转载:皮埃尔Gy 50年的“抽样理论”-WCSB1:致敬”,TOS论坛6 (6),4 - 7 (2016)。
- p . Gy“采样的离散材料——一个新的采样理论概论——即定性方法”,Chemometr。智能。实验室系统。74 (1),7-24 (2004)。https://doi.org/10.1016/s0169 - 7439 (04) 00167 - 4
- K.H. Esbensen和p . Paasch-Mortensen过程抽样:抽样理论——失踪的链接过程分析技术(PAT)”,过程分析技术,由k . Bakeev Ed。约翰威利& Sons,奇切斯特,页37 - 80 (2010)。https://doi.org/10.1002/9780470689592.ch3
- R.J. Romanach,抽样理论——从“缺失环节的重要推动者,过程分析技术(PAT)”,第八届世界会议上采样和混合艾德,南卡罗来纳州Dominy和K.H. Esbensen。澳大利亚采矿和冶金研究所,澳大利亚珀斯,第68 - 63页(2017)。
- 丹麦标准基础上,DS 3077代表抽样水平标准。丹麦(2013)标准的基础。
- p . Gy,采样分析的目的1版。威利,纽约(1998)。
- F.F. Pitard,抽样和抽样理论实践。CRC出版社(2019)。https://doi.org/10.1201/9781351105934
- a . Sanchez-Paternina当然Sierra-Vega诉Cardenasr·门德斯,K.H. Esbensen R.J. Romanach,“Variographic分析:质量保证药品混合过程的新方法”,第一版。化学。Eng。124年,109 - 123 (2019)。https://doi.org/10.1016/j.compchemeng.2019.02.010
- R.L.绿色,g . Thurau北卡罗来纳州Pixley, a·马特奥R.A.里德和摩根大通(J.P.希金斯,“在线监测的含水率在流化床干燥器使用近红外线光谱学考虑采样的影响方法的准确性”,半岛综合体育官方APP下载德甲肛交。化学。77 (14),4515 - 4522 (2005)。https://doi.org/10.1021/ac050272q
- 式样马修斯B.N.浆果,j . Smelko j . Moretto b·摩尔和k . Wiltberger”闭环控制乳酸浓度在哺乳动物细胞培养的拉曼光谱导致细胞密度提高,生存能力,和生物制药蛋白质生产”,半岛综合体育官方APP下载德甲生物技术。Bioeng。113 (11),2416 - 2424 (2016)。https://doi.org/10.1002/bit.26018
- 动向Esbensen b·斯沃布里克,多元数据分析——在实践中。介绍了多变量分析、流程分析技术和质量设计,第六版。这种软件,奥斯陆,挪威(2018)。
- K.H. Esbensen, R.J. Romanach和公元Roman-Ospino抽样理论(TOS):一个必要且充分的保证可靠的多元数据分析在医药制造业“,多变量分析在制药行业由美联社费雷拉Ed J.C.塞斯和m . Tobyn (Eds)。学术出版社,伦敦,53 - 91页(2018)。https://doi.org/10.1016/b978 - 0 - 12 - 811065 - 2.00005 - 9所示
- h·马克,光谱校正的原理和实践。威利(1991)。

Rodolfo Romanach
Rodolfo Romanach博士是波多黎各大学的化学教授——马亚圭斯校区校园,和网站结构中心的有机颗粒系统的领导者。他在制药行业工作了12年之前,在1999年加入了UPR化学系。他发现他的使命在训练新一代的制药科学家能做实时测量过程在生产区域。他目前的持续努力提高化学计量学的教学,进一步理解错误,影响实时过程的测量和如何应对这一切。0000-0001-7513-7261
(电子邮件保护)

Aidalu Joubert
Joubert博士副教授波多黎各大学的化学——马亚圭斯校区的校园。她加入了化学系毕业后在1998年华盛顿州立大学。从2014年到2016年,她担任临时系主任,此后,她的努力集中于几个本科分析化学课程教学。0000-0003-3639-3566
(电子邮件保护)

金正日Esbensen
金正日Esbensen博士,博士(鸿)有从事研究和学术界了40年,现在是一个独立的研究人员和顾问,成立KHE咨询。训练有素的地质学家/地球化学家/数据分析师,他第一次在化学计量学的前沿工作了20多年,但自2000年以来已将他的大部分努力代表采样非均匀材料,流程和系统,帕特和化学计量学。他一些科学团体的一员,在260年出版的同行评议的论文和两个广泛使用的教科书的作者是多元数据分析和抽样。0000-0001-6622-5024
(电子邮件保护)