金正日h . Esbensen一个和Claas瓦格纳b
一个KHE咨询,www.kheconsult.com。电子邮件:(电子邮件保护)
b抽样顾问。电子邮件:(电子邮件保护)
本专栏中概述的问题,几十年来没有得到适当的关注,“复制”的问题。这个问题是复杂的,有很多混乱的文学。三个答案经常说,在应对的基本问题:“复制到底是什么?”一个re i) replicate samples, ii) replicate measurements or iii) replicate analysis (replicate analytical results). Upon reflection it is clear that these three answers are not identical. The often only implied understanding for all three cases is that a beneficial averaging is carried out with the connotation that important insight can be gained by “replication”. By replicating the specific process behind replicated samples, measurements and results, some measure of variability is obtained; but a measure of what? There are many vague prerequisites and imprecise assumptions involved, which need careful analysis. For starters, i) addresses the精准医疗实验室领域,而2)和3)扮演他们的角色在分析实验室的即使在这里:复制分析重复测量的一样吗?
背景
学科的实验设计(DOE)是一个严格的概念理解和术语,因为周围的控制条件。化学合成的情况受到几个实验因素的影响,温度、压力、浓度的因素例如,很容易了解一个复制实验手段:一是重复实验(s)下运行相同的所有条件可控因素,照顾随机选择所有其他因素,在这种情况下,重复的方差的结果,无论是小型或者大型的,将提供的“总实验的不确定性”,这将是比严格的分析可重复性。在分析实验室的常规操作,变化也反映了影响其他不确定性带来的贡献,例如,从反应物的小规模抽样,未必代表完全“同类股票”。增加不确定性的贡献也可能发生从实验设置精度可以重置一个“重置”温度、压力、浓度水平的辅助因子的化学物种后关掉设置,清洗所有的实验设备?不过,这种不确定性的贡献通常被认为是可接受的部分总分析误差(TAE)。通常上述变成小,或者消失,影响因为周围的正则条件控制能源部的情况。
后退一步,然而,一个可能会发现它同样由另一个技术员相关重复实验,研究人员和/或在另一个实验室,进入著名的分析的概念再现性。可能会有更多,更小的或更大的影响在这个背景下,扩大和仔细的经验总效应估计必须进行为了到达一个有效估计的增强,有效的跆拳道。
看整个lot-to-analysis通路
下面我们解决更多的外部问题,不是传统议程复制,实际上经常遗漏,或被遗忘。
事实上有许多场景和恰到好处的将DOE情况不同。事实上大多数数据集不产生从自满中只分析实验室的四面墙。下面描述是什么构成了对立的各种可能性的研究员/数据分析师必须承认吗重要的采样、处理和其他错误TAE除了有效。总抽样误差(谢霆锋)将包括所有的采样和质量减少误差的影响,所有的发生之前分析。不言而喻,这些错误也必须包含在现实分析错误评估;TAE不足以给相关,有效估计的总有效影响分析结果的影响。我们被迫能够提供一个有效的估计总sampling-handling-analysis不确定性的估计(哎呀:=谢霆锋+ TAE)。
下面的描述应该全面处理复制问题,周围的许多不同的表现,大多数现实的场景。问题的核心是一个关键的问题:什么是“复制样本”?这个问题将会出现更复杂的比似乎乍一看,会收到关注w.r.t.定义和术语。它也会发生这问题是密切相关的验证在数据分析、化学计量学和统计数据。
澄清
在反射会赞赏,“复制”可以关注以下替代lot-to-aliquot通路中的主要取样分析结果:
- 复制的主要抽样过程
- 复制从二级抽样阶段(即首次大规模减少)
- 复制从三级抽样过程(即lab.质量减少)
- 复制从整除准备(如粉紧化)
- 复制从整除仪器演示(如表面修整)
- 只复制的分析(测量操作)(TAE)
图1所示。复制可以在许多阶段执行完整的lot-to-aliquot通路,但也是最现实的情况与一般操作不仅在分析实验室吗?事实证明,所有复制必须真正开始“从”。
最后一个选项相对应的情况“复制测量”最受限制的情况下。但这是否意味着分析整除(瓶)一直停留在分析仪器,而分析师只是“按下按钮”说10倍?可能;在这种情况下,这进一步严格TAE的估计只有。然而,似乎同样相关提取瓶和插入仪器反复,允许温度变化可能影响TAE因为这是一个更多现实的重复的工作和测量过程比简单地离开实验室测试仪器的分。这是首次进入所谓的“田口思维”,1打开一个关注潜在影响因素不明确地嵌入到实验设计。显然在很多情况下这种外部思维有关,因此应包括在复制的方法。田口方法的一个重要的格言是:不一定(只寻找最优的结果可能有大变化),但结果,响应变化较低的大跨度实验域(即使少最优)。这是一个聪明的方式获得更多信息的过程,是这个生产制造过程或分析过程本身。某些怀疑已经表达了对这种方法的优点,但我们会让读者决定这件事。
这种类型的开放的相关性摄动另一位分析师的分析过程中,可能出现同样理由包括一些或所有,“样”程序的复制,因为这些part-operations一定不能以完全相同的方式执行。说,这种效应也应重复10次(阶段4和/或5以上)为了获得测量的方差贡献。
但是有扩大地平线这么远,这是一个合乎逻辑的步骤进一步跟进实际的测量过程的扰动,这基本上意味着包括三级,二级和全面衡量的东西,甚至还主要抽样复制中的错误概念。为什么?因为这些是事实上的不确定性的贡献,已经玩了所有分析整除,曾经受到测量!以下的全部影响理论抽样(TOS)及其详细的治疗的现象非均质性,很明显,唯一的完整的“取样和分析”场景,包括担保所有不确定性的贡献必须从复制的主要抽样(“复制从顶部”)。不全面的复制场景注定是不完整的。
重复主抽样,再说10倍(优先更需要时),意味着每个10个单独取样主要样本正在遭受一个相同的协议,它控制所有随后的业者(减),样品处理和准备阶段和过程在实验室。从这个完整的逻辑representativity通路”,从lot-to-analytical整除”,这是唯一的过程将不确定性和错误的完整合奏遇到任何性质的(采样、处理、制备、表示)。重点是为每个复制的主要样本,将显示所有潜在的错误不同的十个人次引起的累积方差是最现实的估计总测量的不确定性(μ)。2特别是这估计必然包括完整的抽样误差的影响(TSE),这通常会占主导地位。
相比之下,开始任何其他的水平在上面的列表中,阶段2 - 6将保证一个不完整的,不如谢霆锋+ TAE估计,这是结构注定要过低,即不现实的。
应该不过被迫“捷径”完整的复制过程,不是“从顶部开始,一个是吗授权来描述这种选择背后的基本原理,并提供一份完整的报告实际上是做什么,以免用户的分析结果没有办法知道什么是涉及“复制”的范畴。“用户”和决策者,分析数据,不喜欢被蒙在鼓里。
无证或原因不明的应用程序的术语“复制实验”(或“重复实验”)的来源在过去大量的不必要的混乱。很多次年代2(TAE)简单误解了意味着年代2(谢霆锋+ TAE),一个严重的错误,一个人或有人(或一些欠考虑的,不完整的协议)是负责任的。但是我们在这里指责不感兴趣在任何实体(私人或法律);它可以停止继续这样的做法。
上述场景演示了一个不幸的责任上,有时发现在科学、工业、出版或监管环境:
“分析师不应该处理很重要外实验室(如抽样)”
“这部门只有负责的任务减少主样本到可控范围,按照被实验室的指示”
“抽样是自动化,由过程分析技术(PAT)传感器;这里没有涉及抽样问题”
“我不是负责取样,我只分析/模型数据”
…和类似的借口没有看到完整的测量不确定性的背景。经常问题属于“别人”,不可避免的结果,得不到进一步关注的问题。因此这站(“不是我们的责任”)总是可能延续的危险,如果是“复制分析”仍将其起点第三阶段(可能第二阶段),但从未从第1阶段,初级抽样阶段。这不是一个可以接受的情况。有许多场合的作家,评论家,甚至编辑错过了打击与必要的坚定等显而易见的歧义有关“复制”,与读者的某些结果不能够理解的目的是什么,也不知道确实是,因为不完整的“方法”部分描述的科学出版物和技术报告。问题是因此远离琐碎,确实在不断犯下严重的错误。但是而不是解决第一个显而易见的问题:谁负责,这里的出路应是建设性的。应当注重方法和手段把一个有效的复制问题周围的混乱,甚至把它好好利用。
量化的总经验变数的复制实验
上面是勾画了一个现实的估计总谢霆锋+ TAE,复制实验(重新)必须开始“从”。这就是复制开始,这个初级抽样在自然界中,,在工厂抽样,抽样的也可以是任何目标指定为主要(例子遵循下面)。
图2展示了一个场景,在该场景中,一个狂热的取样器正面临一个大很多的目标建立一个现实的估计的平均浓度为一个(或多个)分析物。很显然,当一个抓样站没有机会能够做这份工作因为内在分布异质性的。不管多小,中间或大,这个内在异质性未知的目前常规取样。取样器因此没有其他选择比作为如果它是大大大。没有问题假设这理性的立场,同意条款提供所有必要的管理原则和实用程序和设备评估可能性总是能够处理显著的异质性,如Esbensen &朱利叶斯(2009)。3
图2。主要取样器接近一个显著异构多抓取采样方法,但部署两种截然不同的报道的脚印。意识到左边的再保险非理性狭窄的足迹与完整的几何的规模。右边试图考虑(隐藏的)很多异质性采用更广泛的足迹为基础的。这些替代方案将导致不同的相对抽样可变性估计因为不同的许多异构性问题。(注意:这两个主要取样程序成功样本的内部,所以都不尊重基本抽样原则(FSP)。
通过部署一个再保险,图2(右),现在的取样器访问第一个估计的有效采样过程的可变性,但随着TOS同样清楚的是,有一个严重的违反了基本的抽样原则(FSP)。
相对抽样可变性
人们已经发现有用的衡量抽样可变性的雇佣再保险公司表示,进入RSV:相对抽样可变性。
任何数量的副本的变化可以通过提取和量化分析的分析结果复制主要样本。这些专门有目的封面整个空间几何的是最好的,即生成的几何体积主要许多最优的方式(在这样的情况下),并计算得到的经验变化产生的分析结果一个年代。通常相对较少的主要样本可能满足第一次调查,尽管没有小于10。至关重要的是,标准的取样操作是完全现实的复制例程,即在同一一般不得提取位置,图2(左),这只会导致当地的描述不能够与完整的很多异质性的影响。是什么意思是连续抽样事件主要发生在其他,等可能地点主要抽样是被复制。再保险应当由一个固定的程序,指定下列业者究竟如何,质量进行还原和分析。至关重要的是,初级抽样以及所有业者和质量降低阶段,样品制备是复制以完全相同的方式为了不引入人工可变性的评估。
注意,当遵循这些规定可以进行任何抽样程序,例如一个抓取采样与复合抽样程序。
已经发现方便使用标准的统计结果从再保险。相对变异系数,简历rel是一个信息测量的相对标准偏差的大小(性病)与平均(Xavr的)复制的分析结果,表示为一个百分比:
(1)
RSV被称为相对抽样可变性(或相对抽样标准偏差)。RSV包含所有的采样和分析错误结合所体现的最小采样过程的复制正在评估的10倍。RSV因此措施总经验抽样方差的影响特定的非均质性的材料,所表达的是目前的抽样程序。这是一个至关重要的理解。不可能有更多的相关总结统计重复整个lot-to-aliquot通路的影响程序比RE-based(10倍以上)RSV。
在过去的十年中已经有一个主要讨论在国际社区抽样单一的有用性,规范化RSV阈值;意见不同。在过去的几年里已经达成共识,但是,表明一个普遍接受的阈值的20%。RSV高于20%意味着过高抽样可变性,抽样程序测试的结果必须改善以便更好地抵消了固有的非均质性的影响在很多材料。应该选择接受呢RSV高于20%这必须是合理和公开,确保所有利益相关者完全透明。
有用的RSV测量不可低估。为无论很多材料,取样无论过程中,具体的很多/过程结合可以快速评估。没有麻烦的实用性涉及这可能妨碍执行重新评估;实际上任何人都可以对任何抽样程序进行重新评估,或对任何取样设备等,应该不可能主张或反对,一个特定的抽样程序没有一个透明的定量评估。数字本身就说明了一切。抽样的“困难”问题是完全可以理解的,和非常简单的操作基础。
基于一个50多年丰富的实践经验从许多应用领域和科学领域内,技术和产业,有很多情况记录中,超过20%的门槛(没有重大偏差的很少);但也有一个重要的情况下,现有的程序是正确的。下面给出一些说明性的例子。但首先:信息驻留在一个简单的RSV水平?
图3。复制实验的示意图说明RSV阈值,例如20%,33%,50%,85%和120%。非常大的相对标准偏差(高于约85%),解释为代表标准正态分布时,显然会导致负面集中值。然而,这没有物理意义,并不引起任何麻烦的担心;这些都是没有实际的模型拟合的文物,后果。取样器的基本信息已经显现RSV违背了> 20%时,即当抽样程序也操作变量,必须改进(TOS)。
图3说明了如何性病表示为一般水平的一小部分量化Xavr的。在本示例中白色的分布有一个性病20%的是哪一个Xavr的。还表示情况下经验性病形式,例如:33%、50%、85%……很明显的问题是,在什么%与量化程度的不再是一个舒适的决议,例如RSV= 50%的信噪比为1:1,可能不是一个可以接受的情况下任何账户。
规范化RSV阈值,仅20%,作为一般的参考案例没有什么是已知的先天的涉及材料的非均质性。材料和材料类肯定存在价值更高,或者更低的阈值,提出了一般RSV当然,值可以不再提供。这种情况下,一个material-dependent量化可以开发,依赖于采样器的能力和勤奋。抽样标准DS 3077的授权4是明确的:所有分析结果应伴随着一个合适的吗RSV自愿描述和报道。
图4。的例子复制实验(重新),很容易建立。左边是一个动态的过程抽样情况,在适当的抽样从静止。抽样场景都可以被分配一个客观RSV质量指数。为了不可能发生误解,只需要执行一个适当的,校准一次,作为测量和描述特定的内在异质性很多材料。
虽然水平是可以接受的批评建议阈值(20%),这也意味着义务执行经验尽职调查的形式再保险。最近的工业、科技历史是充裕的例子主要惊喜带来的这种简单复制实验,他们的服务员RSV。它要么是内在异质性低估或材料,在其他时候,抽样过程被证明是更普遍比假定。
再保险的目的通常是评估一个已经存在的抽样程序的有效性。在实践中,再保险只能执行和测试目前的抽样程序相互作用与一个特定的材料。应该一个RSV探索性调查超过规范,或特定的阈值,需要完整的服务条款已实现记录,因此规定,不允许例外。可能有充分的理由开始验证通过测试现有的采样手术中总是可能性它可能会低于相关的阈值,因此是可接受的。但是在其他情况下,必须实现TOS-modifications,没有例外。
一个可以因此视图RSV作为一个灵活和相关的抽样程序质量指标,按比例缩小的固有的非均质性。RSV首次描述尤其有用的抽样静止的很多,而更习惯使用一个动态的、过程抽样增强方法,称为variographics当抽样从动态的很多。RSV和variographics是密切相关的方法从根本上量化相同的异质性;后一种方法更强大,然而,由于它的更复杂的实验设计,允许充分分解啊,看,例如,引用5,6,7,8。Variographic异质性的描述动态很多后面的列在本系列的主题。
上面描述的所有例子属于采样问题和其他误差的贡献之前分析。值得注意的是一些分析方法可以大大大TAE,如10 - 20%或更多的顺序,然后已经列入了经验RSV的水平。原则问题从这里给出的例子可以普遍许多资料和其他许多类型。哇=谢霆锋+ TAE的问题是相同的所有系统。
下面的例子说明了如何评估一个特定的取样设备对几种不同材料(与特定的异构性问题),这可能导致通过和失败。
图5。左上:主要评估过程取样器三种不同的材料,其中一个不通过测试的专用再保险(RSV = 78%)。右下:一个复杂的再保险主要的取样器是受到明显令人担忧的RSV = 158%的结果。注意:说明性的例子,不支持特定的采样器,也不放弃。采样是画只是为了说明可以用于定量评估。
图6。两个实验室设备(分割)进行重新评估,显示高度满意的定量结果。注意:说明性的例子,不支持特定的采样器,也不放弃。采样是画只是为了说明可以用于定量评估。
再保险是一个通用的工具,事实上可以部署在所有阶段lot-to-aliquot通路,即也比初级阶段后采样阶段。如果客观的评估和比较两个分割图6中具体地说,重新在这个业者可能会发起阶段直接(在这种情况下当然仍然从前面添加的抽样误差影响的关键阶段最后评估)。
复制实验(重新)是一个强大的和高度通用的抽样/分析质量评估工具,可以部署以极大的灵活性。有必要充分具体的作为是什么意思“复制”的情况,即在什么阶段lot-to-analysis途径是开始复制。采用多次复制实验我们还会有机会在这些列。
笔记和引用
- 田口方法:http://en.wikipedia.org/wiki/Taguchi_methods
- 相关问题(μ)测量不确定性的概念,这在实践中往往仅覆盖部分的分析过程,可以得到直接的实验室控制(在其全部定义覆盖整个sampling-handling-analysis通路的派头,对待:K.H. Esbensen和c·瓦格纳,“抽样(TOS)理论与测量不确定性(μ)呼吁集成”,趋势肛门。化学。57岁,93 - 106 (2014)。doi:http://dx.doi.org/10.1016/j.trac.2014.02.007
- K.H. Esbensen和石油醚朱利叶斯,”代表抽样、数据质量、验证——化学计量学的必要三位一体”,全面的化学计量学由美国布朗Ed, r . Tauler和r·查克。爱思唯尔,牛津,4卷,页1 - 20 (2009)。
- K.H. Esbensen(特别工作组主席f - 205, 2010 - 2013年),DS 3077。代表Sampling-Horizontal标准。丹麦(2013)标准。http://www.ds.dk
- K.H. Esbensen公元Roman-Ospino, A桑切斯和R.J. Romanach,“充分性和可验证性的药物混合物和剂量单位variographic分析(抽样理论)——呼吁监管范式转变”,Int。j .制药。499年,156 - 174 (2016)。doi:http://dx.doi.org/10.1016/j.ijpharm.2015.12.038
- K.H. Esbensen, c . Paoletti和p . Minkkinen”大型内核许多——即理论的代表性样本采样和variographic分析”,趋势肛门。化学。32岁,154 - 164 (2012)。doi:http://dx.doi.org/10.1016/j.trac.2011.09.008
- c . Paoletti和p . Minkkinen K.H. Esbensen,“大内核许多- III的代表性样本。一般考虑抽样异构食品”,趋势肛门。化学。32岁,178 - 184 (2012)。doi: http / /dx.doi.org/10.1016/j.trac.2011.12.002
- p . Minkkinen K.H. Esbensen和c . Paoletti”大内核许多- II的代表性样本。应用程序为转基因大豆抽样控制”,趋势肛门。化学。32岁,165 - 177 (2012)。doi:http://dx.doi.org/10.1016/j.trac.2011.12.001