半岛综合体育官方APP下载德甲自1975年以来的光谱学
瑞士万通广告
Analytica越南广告

基于nmrum浏览器的核磁共振数据处理

安东尼·n·戴维斯一个还有卢克·帕廷b

一个英国南威尔士大学计算、工程与科学学院可持续环境研究中心
bZakodium Sàrl,路线d 'Echandens 6b, 1027 Lonay,瑞士

DOI:https://doi.org/10.1255/sew.2021.a18
©2021作者
在知识共享许可下发布

正如您将在最近的专栏文章中看到的那样,关于在不同场景中哪种光谱数据格式最合适的讨论很多。取决于您的工作流程。图像可能是最好的格式,即使它伤害了我大脑中“不惜一切代价的标准化”的一面(例如参见参考资料1中的图2)。在关于这个主题的相当活跃的讨论中。特别是通过确保数据处理来保证存储库的未来安全,Damien Jeannerat问我是否看到过一个免费的基于web的核磁共振(NMR)数据处理工具的发布,该工具既可以处理原始数据文件,也可以处理JCAMP-DX NMR标准化文件。这个工具就是nmrum,由瑞士科学数据管理公司Zakodium的Luc Patiny和他的同事制作。我没有听说过他们,所以我看了他们的网页,印象深刻,所以直接问Luc,他是否愿意成为SE专栏的主题,讨论他们现在免费为用户提供的有趣的创新解决方案。(这只是一个快速提醒,FAIR中的“F”可以免费甚至开放获取的标准!)

Luc从一开始就非常坦率地介绍了nmrum系统,以及他们公司所做的开源开发工作背后的精神。我希望你喜欢他的评论,并尝试他们的系统。我相信他们会欢迎任何反馈,你可能有或建议的功能!

nmrum项目的背景——为什么一家公司想要开发一个高级的数据处理应用程序并免费提供?

Zakodium的所有者都是科学家,我们维护和参与了150多个开源项目(其中一些项目涉及机器学习、图像和数据处理等领域)https://www.zakodium.com/open-source)。一个早期的驱动因素是,作为科学家,我们发现太多的数据丢失了,因为它们没有被正确地存储和共享。在为我们2016年的论文进行研究时2我们发现很难找到开放获取的核磁共振光谱。然而,结果表明,如果有更多的数据可用,我们显然可以产生一个非常强大的自学习算法。

无法获得数据的原因之一是,重新处理光谱的软件价格昂贵,而且(正如本专栏在最近的版本中发表的那样!)有些人只提供光谱的pdf或静态图像。也没有直接的工作流允许存储和共享数据(Damien的NMReData格式是一种解决方案)。3.

我们还查看了NMRshiftDB,在他们的数据库中几乎没有JCAMP-DX文件,只有化学位移。

德国政府的补助金4使NMRshiftDB团队能够开发一种在浏览器中处理NMR数据的新方法。我们率先开发了这样一个开源React组件的解决方案。

整个NMRium项目是由瑞士Zakodium Sàrl、德国科隆大学、德国美因茨约翰内斯古腾堡大学和哥伦比亚瓦莱大学合作开发的。该项目由IDNMR DFG赠款、Zakodium Sàrl和哥伦比亚卡利的Valle大学资助。

Zakodium Sàrl我猜它是一家商业公司——它打算开始让人们为这项服务付费吗?

Zakodium是一家专门从事科学数据存储和处理的公司,其目标是将数据转化为知识。处理核磁共振光谱的服务将保持免费(无论如何,它是一个开源项目,你可以只拿一个组件的副本)。我们的付费服务包括咨询、定制开发和数据管理。

当您说服务器上没有后端处理,因此它是“安全的”时,是否有任何数据存储在web服务器上,或者所有处理都在本地内存中进行-因此仅在本地PC上有效?

我们注意到所有的处理都是在您的PC上完成的,没有任何东西被发送到服务器。作为一个实验功能,你甚至可以在本地PC上安装它(作为一个PWA,渐进式web应用程序),你将能够离线处理核磁共振光谱。网站上有一个小图标,允许这样做(图1)。

图1所示。这是在Windows 10下使用最新的Chrome浏览器拍摄的截图。

即使你使用这种URL访问光谱,https://www.nmrium.org/nmrium ? jcamp = https://cheminfo.github.io/nmr-dat..。,我们注意添加这个“#”,以便您的浏览器不会将jsp - dx文件的URL发送到我们的服务器。艾德:我得查一下这个!在JavaScript中,#字符之后的查询仅由在您的机器上本地运行的服务的客户端处理,而不会解析回服务器。)

您如何描述由于NMRium的发布而得到改进的最先进的环境?

我们相信,在未来,你的电脑上唯一需要的应用程序是一个网络浏览器。事实上,40年后,你的电脑再次成为一个“终端”(你处理的数据不是本地保存在浏览器里的)。虽然今天在浏览器中使用电子表格、文字处理器或电子邮件很容易,但处理光谱几乎是不可能的。这意味着到目前为止,您必须在处理光谱所需的所有计算机上安装应用程序。安装软件是昂贵的,不仅是许可证,还有安装软件的IT成本(在一些公司,这真的很复杂)。

通过使用web应用程序,您可以避免安装和更新的所有问题(只需重新加载页面,即可获得最新版本)。

在行动中

好的,谢谢Luc,让我们看看nmrum的实际操作。当您打开程序时,您会看到一大片白色区域,上面有一些关于如何继续操作的清晰说明(图2)。

图2。

对于我们这些不阅读指令而只是尝试将NMR文件转储到程序中的人来说,它们会很好地提醒您真正需要做的事情的更多细节(图3)。

图3。

我对自己的过度自信感到尴尬(顺便说一下,谁读过快速入门指南?),我决定用Peter Lampen的原始jamp - dx编码测试文件测试系统,这些文件是1D乙苯核磁共振光谱和FID编码,使用各种允许的jamp - dx XY-DATA编码标准算法AFFN, PAC, SQZ, DIFF和NTUPLES格式。从图4中可以看到,NMRium以优异的成绩通过了测试,这表明最初在1992年使用JCAMP-DX NMR 5.01标准格式保存的NMR数据在近30年后仍然可以读取。

图4。

有所有常见的核磁共振数据处理工具,你会期望包括1这是我对罗伯特·兰开夏最喜欢的苯乙酮进行的H-NMR预测,但我已经没有空间展示更多的数据了。

结论

我很高兴看到新的开放应用程序的出现,我们可以测试FAIR原则和多年来开发的数据寿命策略。

像nmrum这样的工具将极大地帮助向FAIR世界转变,因为它意味着那些无法支付昂贵的专业光谱软件的采购和维护合同的组织仍然能够获得相当详细的访问和分析存储在开放光谱数据存储库中的光谱。

达米安对这种能力的愿景更进一步,“任何人”都可以在一个迷你web服务器上提供一组光谱,实际上是一个GitHub页面。他和Mestrelab Research的Carlos Corba在最近的一篇论文中发表了一个例子。5很容易想象为Zenodo, Dataverse等存储库提供一个迷你站点,包括NMR。如果这些存储库有一个一致的、开放的和统一的结构,这就可以完全自动化(消除我们在EuroSpec光谱存储库中的一些手动步骤)。

创建这样一个数据集需要将一个谱放到nmrum中,然后使用Save As…循环来创建jsp - dx文件(使用一个简单的前端页面的归档伪造可以很容易地实现自动化——是的,我一直在谈论这个!)然后脚本自动生成一个内容文件表,该文件最终作为URL的锚。非常优雅的东西!

nmrum格式允许光谱包含嵌入链接。很好地避免了重复数据。理想情况下,如果链接可以从存储库中的zip文件中提取单个文件,那将是NMR考古的梦想成真!

事实上,如果你想看更多,下面有一个简短的解释视频https://www.nmrium.org/videos/presentation。比我为本专栏创建的更好的例子,包括2-DNMR,可以在https://www.nmrium.org/nmrium#?toc=https://cheminfo.github.io/nmr-dataset-demo/samples.json。您还可以从https://github.com/cheminfo/nmr-dataset-demo来尝试整个过程。顺便说一下,请注意示例URL启动了nmrum,但加载了它从GitHub显示的数据集。达米恩,你的梦想就要成真了!

请大家注意安全!

参考文献

  1. R.M. Hanson, D. Jeannerat, M. Archibald, I. Bruno, S. Chalk, A.N. Davies, R.J. Lancashire, J. Lang和H.S. Rzepa,《公平吗?”,Spectrosc。bdapp官方下载安卓版欧洲33 (2),25-31(2021)。https://doi.org/10.1255/sew.2021.a9
  2. 点卡斯蒂略,A.伯纳尔,R.迪登,L.帕廷和J.威斯特,“问Ernö:核磁共振谱分配和预测的自学工具”,j . Cheminform。8,26日(2016年)。https://doi.org/10.1186/s13321-016-0134-6
  3. S. Kuhn, L.H.E. Wieske, P. Trevorrow, D. Schober, N.E. Schlörer, J.-M。Nuzillard, P. Kessler, J. Junker, A. Herráez, C. far, M. erd和D. Jeannerat,“NMReData:工具和应用”,粉剂。的原因。化学。出版前在线(2021年)。https://doi.org/10.1002/mrc.5146
  4. IDNMR格兰特。德国科学图书馆服务和信息系统计划(DFG)的一部分,资助号:SCHL 580/3-2, LI 2858/1-2。
  5. D. Jeannerat和C. Cobas,“多重结构反卷积在一维核磁共振光谱中标量耦合常数提取中的应用”,粉剂。的原因。讨论。预印本,审稿中(2021年)。https://doi.org/10.5194/mr-2021-32
托尼•戴维斯

托尼•戴维斯

托尼·戴维斯是一位资深的半岛综合体育官方APP下载德甲光谱学欧洲bdapp官方下载安卓版专栏编辑和公认的思想领袖,在标准化和监管合规的脚在工业和学术阵营。他的大部分工作时间都在德国和荷兰度过,最近在荷兰阿克苏诺贝尔/诺利恩化学公司担任测量和分析科学战略研究小组的首席科学家。大力倡导正确使用开放式创新。
Orcid iD符号0000-0002-3119-4202
(电子邮件保护)

Luc Patiny

Luc Patiny

Luc Patiny有有机化学和结构分析的背景,20多年来一直对将化学信息提供给计算机感兴趣。他积极参与开源工具的开发,这些工具可以免费访问,并且可以直接从web浏览器运行。
Orcid iD符号0000-0002-4943-2643
(电子邮件保护)

评价这篇文章
还没有投票
技术:
Baidu
map