半岛综合体育官方APP下载德甲自1975年以来光谱学
瑞士万通广告
越南—广告

当将光谱数据处理自动化

加里·沙曼一个马塞尔·g·西蒙斯b和安东尼·n·戴维斯c

一个Mestrelab研究。L菲·巴雷拉9 b-bajo 15706年,西班牙圣地亚哥德孔波斯特拉
b专家能力小组——测量和分析科学(ECG-MAS) Nouryon, Zutphenseweg 10, 7418 AJ代芬特尔,荷兰
c国家电力、可持续环境研究中心、学院计算、工程和科学,英国南威尔士大学

我最近的一篇文章阅读与兴趣化学科学原始的乔纳森·古德曼的剑桥大学。乔纳森是另一个长期存在的IUPAC运动科学数据标准化和他的团队一直致力于改进解决棘手的核磁共振(NMR)谱的解释。1他们的方法利用现代高处理速度提高全自动分子结构说明软件。他们DP4-AI使用量子化学Gauge-Independent原子轨道密度泛函理论(GIAO-DFT)方法计算从化学结构与未定义的立体化学。1H和13理化性质选择算法处理的光谱峰值预测相对立体化学。统计值是生成的每个候选分子的可能性是正确的基础上,分析了光谱几乎不需要人工干预。这使它理想的工具来快速解决困难问题像天然产物库验证。

显然,仍有强劲的需求改进的核磁共振数据解释和预测软件。我想知道有多少这样的系统被用于日常生活中在工业,所以跟加里·沙曼在分析科学享有20年的职业生涯在制药业和马塞尔·西蒙斯,非常有经验的NMR专家和我以前的一个同事在阿克苏诺贝尔公司/ Nouryon。

为什么自动化?

许多年前,我听到一个评论,停留在我的脑海里,还提出了一个微笑当我有机会记住它。制药行业的客户之一的克瑞翁·LabControl AG)是测试一个创新结合紫外/可见(UV / vis)和质谱(MS)自动化的方法对“已知的化学”天然产物库筛选选择提取以进行进一步的处理。测试一段时间后,客户向软件开发人员解释原因他的兴奋。完全忽略了技术进步和聪明的编程进入系统正在测试,客户只是指出自动化光谱数据处理系统有效地消除无聊的重复工作。提取的不感兴趣(化学)是自动删除允许他和他的团队迅速集中在提取感兴趣的潜在的新活跃分子。“我终于可以花大部分时间做专家的工作我的公司实际上是支付我”。

如此多的人们增加自动化的想法可能是负责工作远离光谱学家!加里·沙曼强调三个方面可以被视为主要的司机更好的自动化:

  • 失去了机会:问题没有自动化,我们甚至不会敢开始。
  • 腾出时间更有趣的工作。我们都成为了棘手的光谱学家,有趣的问题,而不是生产在常规分析和簿记员。让自动化照顾的苦差事,这样你就可以专注于有趣的问题。(就像上面的UV / vis-MS示例。)
  • 愚蠢的错误/簿记错误少。我们都觉得我们是准确和精确的,但事实是人类做很多愚蠢的错误,尤其是在整理数据。电脑不要犯这样的错误。

有切合实际的期望

有这么多自动化的危险在我们的指尖是我们可能设置了一些壮观的瀑布自动化遇到问题的时候不能掌握。你经常看到这种更简单的系统,如气相色谱法(GC) /女士数据库搜索结果的电子电离作用光谱。在本专栏中我们已经讨论了许多创新的解决方案在过去,但我一次又一次的看到报道,碰到的第一个数据库是引用的化合物—甚至如果提出的化学分子可以与实际工作。如果科学家/学生花时间看进一步的名单,他们会发现一种物质,更有意义的实验进行。

所以,正如加里…如果你想要完美地分配NMR光谱每个时间,作出了现在!一个更好的目标是真的问自己什么级别的错误你准备容忍,以及它如何交易与努力。例如,考虑一个大型图书馆的质量控制;没有自动化,你可能会认为,它不能被完成。与自动化也许我们有5%的假阳性。它并不完美,但肯定比没有纯洁的数据。

所以,问问自己什么级别或错误你愿意接受。是现实的。人人都说“我希望100%的准确率”,但即使是有经验的光谱学家也不能实现。你可能会使一个微不足道的错误像混合了两个样品或者只是在你不熟悉的复杂的化学反应。

自动化的过程

加里描述这个过程类似于乔纳森·古德曼的集团和这实际上适用于不同类型的光谱(图1)。半岛综合体育官方APP下载德甲

图1所示。部分的自动化过程;并不是所有的过程都部分。以及自己的步骤,和他们的输入和输出接口,其他系统可能是成功的关键。

虽然这可能被视为一个相当简单的模式,它是好的,看看自动化将有利于我们在流程中的各个步骤。

  • 数据准备和元数据提取。不要忽视了这个可能是一个快速获胜。例如,自动找到并打开连接的数据,查找一个结构和加载它,保存结果部分,需要时间和繁琐的记账,但每个过程都需要他们。
  • 数据处理峰值选取和分类等。这是一个非常重要的过程的一部分。许多自动化结构验证“错误”,只是可怜的挑选数据的峰值。
  • Prediction-unless我们查找数据库中的一个已知的东西,我们通常必须预测预期的结果进行比较。这可能非常简单(MS)什么是预期的离子或复杂的(核磁共振的预测从头开始方法)。
  • 匹配预测实验。对于某些应用程序,这可能是微不足道的:最大的峰质谱一样m / z我期望。对质子核磁共振耦合的复杂性,重叠和高阶效应,它是非常困难的。
  • 得分和输出与我们需要返回一个有用的值,可用于设置操作。我们可能还想返回“质量因素”表明如果结果是可信或者手动审查是一个好主意:这两个东西很可能是正交的。测试可能的失败并不意味着需要审查的数据,和一个通过可能不意味着它是一个有效的结果。

审查通过例外策略

尽管你可能认为这是一个过分简单化,手动分析是“慢、准确”。自动化通常被视为“快,但容易出错”。通过标记样本进行审查,有理由相信自动化的结果可能会怀疑,我们可以得到两全其美(图2)。

图2。自动化的支持,减少手工数据分析关注可疑的结果。

我们不单独工作!

我们总是问关键问题之一就是一些新的wonder-software如何融入我们的日常工作实践和过程?

  • 自动化步骤只有一半的问题你要联系您的流程与其他流程在你的组织吗?这可以使或打破自动化。工作流工具如瑞士KNIME矿工的康斯坦茨信息(免费和开源数据分析、报告和集成平台)2或Biovia管道的飞行员3可以在这里是有价值的。也有信息通过api或web服务公开使得集成变得更加容易。
  • 约束。你可能需要处理遗留系统,其他软件与特定需求或无益的其他数据的接口。这可能是一个主要问题,影响设计和实现的一部分。
  • 柔软的零件号码人喜欢电脑告诉他们犯了一个错误。要接受一个系统,它可能需要思考人们如何是失败的通知。例如,一个电子邮件说你和你的老板做了错事复制可能是一个糟糕的举动。萎靡不振的一个错误,一个专家评论它,安静的词可能更接受。
  • 新的问题。现实世界的数据并不完美。低信噪比、准备不充分的样本和其他的组件(比如残留溶剂可能导致失败,一个人会处理正常接受实践的一部分。
  • 边界情况。软件是建立在有限的测试数据集和验证。随着时间的推移可以保证边界情况将发现它不处理。希望随着时间的推移,越来越多的边界情况处理,他们变得越来越频繁。

坚持世界是COVID-19主题,一个自动化的结构性验证(ASV)软件包Mestrelab的“验证”模块可以做一个优秀的工作分配一个分子,如药品活性成分在干净的样品。期待一个完美的作业每次都可能希望太高了。不足之处并不影响系统是有用的。

使non-spectroscopist同事

马塞尔·西蒙斯和他的同事们一直在努力帮助来自其他学科的同事在特种化学品和制造业领域的研究在某种程度上体现了上面列出的许多优势,但在一个完全不同的环境。他们挑战更与由核磁共振定量分析而不是纯粹的结构说明。专家功能小组的开店NMR应对工作负载非常高的业务,和实时samples-often产生正常实验室时间。他们早在2006年就开始配置自动光谱数据分析。与仪器供应商支持,他们有30多个自动化的开发和部署方法,为工厂做任务,如数据处理的支持。这些方法超越了现成的工具,是为了工作使用简单的抽样策略在所有液体样品可用信号即使没有氘溶剂的使用。

自动化的结果基本上是处理光谱和专用的Excel文件所需的积分计算摩尔比率和/或和正常体重的百分比计算。取决于目标的自动处理和特定的业务客户的要求,应用条件格式突出绿色如果处理的结果交付预期的结果和红色如果数据没有预期,可能需要额外的操作(图3)。

图3。最后一个复杂的自动化NMR数据处理方法,客户问题可以归结为“两种化合物的浓度的比例是在特定的目标范围内质量标准”。在这个图中,结果表明通过和下一个失败。

结论

所以,看起来很清晰的情况下继续发展更快且不易出错自动光谱数据处理。乔纳森的团队取得了他们的新软件开源MIT许可下可用,所以如果你想尝试当你坐在家里担心第二COVID-19波可以从GitHub下载。4

加里在最近的一篇论文的作者之一,这里汇集了许多讨论的话题。5本文讨论了一个自动化的系统来验证新的化合物注册。其核心是Mestrelab验证引擎自动验证注册结构对NMR和液体chromatography-MS数据。这是包裹在一个web服务访问由外部过程简单。记账任务,调度和其他系统的接口被照顾KNIME服务器,和一个精简的审查程序被放在合适的位置,确保有一个人脸样本处理任何问题。

引用

  1. 豪沃思,k . Ermanis J.M.古德曼,“DP4-AI自动化NMR数据分析:直接从光谱仪结构”,化学。科学。11日,4351 - 4359 (2020)。https://doi.org/10.1039/d0sc00442a
  2. KNIMEhttps://www.knime.com
  3. 管道试验https://www.3ds.com/products-services/biovia/products/data-science/pipeline-pilot/
  4. https://github.com/KristapsE/DP4-AI
  5. J.A.广告看板,g·沙曼,t·威尔金m·赫斯特,c . Cobas和m . Goebel KNIME工作流自动化结构验证,sla发现(2020)。https://doi.org/10.1177/2472555220907091
本文率
没有票
Baidu
map