迈克·鲁上校一个丹·霍普金斯一个和A.N.戴维斯b
一个LGC,希思商业公园,道,英国柴郡WA7 4季度
b格拉摩根大学分析科学教授,国家,英国;导演,分析实验室信息的解决方案
介绍
我很高兴当迈克·鲁上校的一位活动家EuroSpec项目提供在LGC TopCombi项目报告。这个项目不仅将使用标准AnIML草案的XML数据从纯粹的归档到实验室工作流技术向前发展。我也请看到的参与Burkhard Schaefer一直相当大的内部驱动力AnIML开发团队早在学生时代和时间花在NIST与加里·克莱默。
在“真正的实验室AnIML”
分析信息标记语言,更好的被称为AnIML,已经存在多年来作为一个概念,但如何分析化学实验室使用它在“真正的”?研发的一个科学家小组在LGC已被发现。
AnIML是什么?AnIML是一种新兴标准能够捕获数据从多个分析测量,并在ASTM工作小组正在开发。AnIML数据标准提供了一个开放的、通用的基于xml的格式,用于分析数据和适合使用许多不同的分析测量技术包括色谱,UV, IR, NMR, MS。AnIML文件存储分析结果,设计方法信息和样本数据,并可以包含完整的工作流描述允许重复的实验。此外,XML数据格式现在使用非常广泛,是一个强有力的候选人长期可读性和归档。它有强大的支持产业,政府和仪器供应商,但迄今为止其应用在一个实验室工作尚未公布。由欧盟资助的项目称为TopCombi(由组合优化化学过程和新材料科学),LGC Burkhard Schaefer BSSN软件一直在与确定AnIML数据标准可用于实践在现实实验室项目使用多个测量,并了解相关的好处和挑战采用的标准。
LGC目前的科学研究的多学科性质,以及科学仪器的发展凸显了记录的传统方法的不足,分析和存储时间敏感的科学数据。数据处理步骤从高通量测量这些是当前研究的一个重要瓶颈操作,产生的数据在多个阶段的试验工作流程,在许多不同类型的专业实验室设备,在许多不同的格式。独立于供应商的,电子数据标准将产生非常有益的影响其研发的效率和质量,促进数据库的使用,使吸收通用数据操作软件,允许数据被存储在一个可读的格式长时间。
为了让数据处理的效率方面的研发实验室,实验数据是最理想的生成和存储在一个单一的格式。同时workflow-driven工具和自动化可以照顾文件转换其他格式,减少人工交互数据,标准化将大大简化所需的数据处理的步骤,增加数据的潜在用途(例如通过集中存储在智能结构的数据库),并确保长期可读性和访问。在这样一个时代,商业研究正日益将有适当的文档的实验和长期归档的电子数据20年或更长时间,这方面变得越来越重要。LGC的团队花了大量的时间确定一个合适的分析实验使用AnIML代表。工作流模型选择覆盖多种技术包括质UV和IR。的目标是收集足够的细节,所有的数据输入到一个AnIML文件,让第三方复制实验。
LGC为了评估的可行性AnIML数据格式从他们的观点和他们的客户,实际数据是典型的参考材料。直接从分析可行,数据生成工具软件接口,和BSSN软件开发翻译工具将这些数据转换成AnIML格式。
AnIML适应满足LGC的需求
大量的工作集中于调整草案AnIML技术定义允许捕获所有必要的信息的质数据。提取的实验数据和结果多种文件格式生成并存储在软件技术上具有挑战性的。每个质运行捕获在文件系统上的一个文件夹,文件夹包含多个XML和二进制文件。成立的XML文件包含样本信息,设备描述、仪器设置,有限的方法信息和其他各种配置选项。实际的方法定义和测量结果存储在二进制文件不记录。解析XML数据的文件似乎是可行的,所以可以使用这种技术来提取许多领域。然而,访问结果数据证明是更加困难。发现当前仪器软件支持导出原始光谱mzData XML格式,这是有据可查的,因此可能是阅读和提取原始数据。
自动提取的光谱mzData原型格式解析器实现。这个工具按顺序遍历源文档,寻找描述一个质谱数据元素。当发现光谱数据提取。由于光谱是二进制base - 64编码,他们需要解码和存储作为一个AnIML SeriesSet以后可以重复使用。一些数据不能从仪器软件中生成一个输出文件手动输入AnIML实验文件。迄今为止AnIML”技术定义”,由ASTM工作组,质是处于起步阶段,这工作将有助于未来发展的标准。
数据量
一个质实验产生的大量的数据提供了一个额外的挑战当试图提取原始数据更新,准确质谱仪仪器可以创建最多1 GB /小时的操作。这使得它不可能保持整个数据文件在内存中,为了克服这一问题流解析方法必须被使用。
那么LGC学习本研究AnIML的未来是什么?这项工作表明AnIML是可行的格式记录实验室工作流程和结果准确地从复杂的实验室仪器。有许多挑战需要克服,如缺乏充分定义为质AnIML技术定义。然而,随着时间的推移,技术和相应的技术定义的数量将会增加,这工作时应该有用工作组形成发展质这个元素的标准。
LGC以及其他科学组织,需要分享的能力和长期保存数据不依赖昂贵的特定于供应商的软件,和AnIML将允许在XML基于文本的人类可读的格式。AnIML成功的关键在于这种能力。
结论
工作开展TopCombi e-Standards和验证AnIML数据标准获得了重要的利益从TopCombi和外部合作伙伴。web会议传播事件由LGC和BSSN软件(由ASTM)在2009年11月举行,出席17日组织得很好,包括那些来自国际制药行业、软件供应商、国家政府机构和学术团体。在AnIML收养的早期阶段,数据需要翻译工具来生成AnIML文件从各种仪器和其他软件平台。然而,从长远来看预计将仪器和软件制造商广泛应用自动化的生成输出文件AnIML格式,使AnIML文件上载到系统从其他来源。很明显,AnIML有着光明的未来,似乎将扩大从其根源分析化学和其他科学领域。
为进一步信息AnIML, BSSN Topcombi LGC看到下面的网站连结。
评论
有趣的是,尽管采用这些标准是在早期阶段他们已经紧密联系,作为一个必不可少的关键技术,确保在制药sector.-TD重组期间持续的法规遵从性
进一步的阅读
www.bssn-software.de
www.lgc.co.uk
www.topcombi.org
animl.sourceforge.net