半岛综合体育官方APP下载德甲自1975年以来光谱学
瑞士万通广告

光谱数据处理在pb级别

安东尼戴维斯,a、b肖恩·r·埃利斯c本杰明•巴鲁夫c和罗恩·m·Heerenc

一个战略研究小组,测量和分析科学,阿克苏诺贝尔化学品b.V。代芬特尔,荷兰
b国家电力、可持续环境研究中心、学院计算、工程和科学,英国南威尔士大学
c马斯特里赫特多通道分子成像研究所M4I Universiteitssingel 50, 6229 ER马斯特里赫特,荷兰

对于许多分析光谱学工作者来说,数据处理的挑战出现时每隔几年空间之间移动数据使用的u盘光谱仪和办公室电脑变得完整。马斯特里赫特多通道分子成像研究所的成立与M4I Brightlands马斯特里赫特健康校园和相关任命两个新教授,教授罗恩Heeren的利益与分工的成像质谱和教授彼得·彼得斯和Nanoscopy分工,一场完美风暴的数据已经创建。在欧洲最大的分子成像中心,罗恩Heeren团体研究高分辨率生物系统和聚合物的分子成像的bdapp官方下载安卓版发展和应用先进的质谱为基础的分子成像方法纳米和生物医学研究。彼得·彼得斯的团队使用技术,如高分辨率低温电子显微镜研究复杂的细胞内蛋白质结构。这个有远见的战略决策,马斯特里赫特大学吸引了大量资金的位置,并允许一个无可匹敌的能力建立仍在增长。

尺寸数据的风暴

与一些主要的仪器供应商一起工作在我们的领域现在生成数据的速度100年代的gb /天。这些大量的数据需要迅速和安全地存储在一个位置也是设计能够提供这些数据回到个体研究人员在他们需要的时候开始数据分析和处理的任务,一个重大的挑战在本身。先进的开发工作的一个例子与商业公司进行的测试是一个新的并行成像MS / MS nanoTOF二世从物理电子学(φ)(图1)TOF-SIMS光谱(MS1)和MS / MS谱并行(一份)。这个high-information-volume方法允许研究人员直接比较光谱,图像或从MS1深度资料,一份相同的三维体积包含成百上千或者更多的像素。

TD-28_1-F1

图1所示。新的物理电子学NanoToF II串联在马斯特里赫特M4I SIMS系统操作。

在另一个新的仪器,力量rapifleX MALDI Tissuetyper™飞行时间(TOF)提供收购率高达50倍其他MALDI成像系统,他们从实验生成的结果进行大脑部分像素大小10×10µm不等250×50µm2。生成的数据在两个正面和负离子模式产生了信息丰富和补充脂质谱揭示空间lipidome成分在老鼠大脑的变化。仪器的速度允许整个老鼠大脑成像连续在两个正面和负离子模式~ 35分钟。1这些高采集速度允许工作在新类的矩阵不稳定在高真空下MALDI-MSI研究,但是,当然,这意味着大量的数据现在获得的速度快得多,因此将对IT基础设施的进一步要求。一个典型的实验从这个工具(参见图2)收益率数据在10 - 100 GB /组织。在这种特殊情况下的原始数据流是由超过181000个人20µm质谱测量的分辨率。当然这样的进展为临床研究分析大型组织的群体。在这方面TBs的原始数据,预计随着保密,必须认真对待病人数据相关联。

TD-28_1-F2

图2。(一)正离子的图像(PC (40:6) + K) + PC (38:6) + K +和(PC (36:1) + K) +观察到m / z 972年,844年和826年显示为红色,蓝色和绿色,分别收购了20×20μm光栅。这张照片包含181723像素。(b)扩大地区显示这些离子互补分布的小脑。相应的H&E-stained部分显示在右边。从引用复制1许可;©2015年约翰·威利& Sons有限公司

另一个大数据领域生产和分析这组在马斯特里赫特的团队致力于开发医学应用水iKnife快速蒸发电离质谱(兰斯)系统及其相关数据库。这个系统允许手术切除组织的分子分析切削过程中实时收集并引入质谱仪产生的烟雾从水域Xevo系统(在本例中)。它在很大程度上依赖于生成和访问组织和特定疾病数据库相比,分子的组织接触外科刀。因此为外科医生提供实时反馈的类型组织切割,使肿瘤的组织和健康组织的分化。这个关键信息,基于一系列收集质谱,有助于确保所有肿瘤组织和最小化需要后续手术移除。

风化暴雨的处理设施

为了高效地掌握内部数据海啸和为研究人员提供的机会实际上解释数据量和转换成知识(相关的出版物当然!)以下基础设施已经到位(见图3)。

TD-28_1-F3

图3。非常粗略的数据生成的轮廓在M4I出版通路。

it基础设施的要求数据处理有两方面:一方面大量的数据必须存储在某处(存储空间),产生的数据超过标准个人电脑存储的可能性。,另一方面,这个数量的数据必须在很短的时间内从和存储(网速)。

M4I,拍字节集中存储系统从日立数据系统已经安装通过千兆以太网连接工具连接,数据分析客户和大学网络。为了减少存储之间的数据传输速率和数据分析单元,质谱分析成像(MSI)动态数据处理和减少在收购。后者可能导致减少100到1000倍,这取决于类型的数据,使研究者的分析可接受的响应时间。MSI数据可以极大受益于由处理,作为一个MSI个人质谱,每个数据集是一组光谱分别是可以治疗的。因此,商业以及利用多核处理系统内部开发的软件。马斯特里赫特大学目前有64芯的两个节点,每一个512 GB的RAM可用内存。作为合作伙伴在荷兰生命科学网格,可以高档更大使用其他参与中心的集群计算能力。

数据分析的另一个重要支柱,成功的解释和代相关的结果,是一个it基础设施的集成数据和其他数据。的上下文中运行的项目与学术合作医院的马斯特里赫特(AZM),这可能是临床数据或其他类型的数据已经通过其他技术从相同的样本/病人(如基因数据、核磁共振扫描等)其他数据也可以元数据等相关实验仪器设置在数据采集或样品制备协议。这种存储和集成的it基础设施还支持履行公平数据标准的要求。

合理的数据

M4I是,与其他通行研究小组的一个成员荷兰Techcentre生命科学(迪泰)启动子的公平数据方法(http://www.dtls.nl/fair-data/)。长期本专栏的读者将毫无困难地认识并欢迎公平数据背后的理想方法。他们描述的数据应该是:

可发现的容易找到人类和计算机系统和基于强制描述的元数据,使发现的有趣的数据集;

可访问的长期存储,这样他们可以很容易地访问和/或下载与明确的授权和访问条件(开放存取在可能的情况下),是否在元数据的实际的数据内容;

可互操作的准备好被人类结合其他数据集以及计算机系统;

可重用的准备用于未来的研究和使用计算方法做进一步的处理。

因此迪泰正与同样感兴趣的国际机构公平数据管理的科学信息(https://www.force11.org/group/fairgroup/fairprinciples)。

这些完全放下一个组织需要采取什么措施以满足公平的理想数据的方法。这仍然是正在进行中的工作很好但是对齐作为明智的大数据归档的一般原则不仅在bio-spectroscopy领域,对我们所有人不管我们的感兴趣的特定区域。半岛综合体育官方APP下载德甲

可发现的:

F1。(元)数据被分配一个全局唯一和永远持久标识符

F2。数据丰富的描述元数据

F3。注册(元)数据或索引搜索资源

F4。元数据指定数据标识符

可访问:

A1。(元)数据是可收回的标识符使用标准化的通信协议

A1.1。协议是开放的,自由和普遍实现

A1.2。协议允许一个身份验证和授权过程,在必要时

A2。元数据是永远,即使不再可用的数据

可互操作的:

I1。(元)数据使用一个正式的、访问、共享和广泛适用的语言知识表示。

I2。(元)数据使用遵循公平原则的词汇表

I3。(元)数据包括限定引用其他(元)数据

可重用:

R1。元(数据)有一个毁灭性的准确以及相关的属性

R1.1。(元)公布的数据是一个清晰的和可访问的数据使用许可

R1.2。(元)数据与他们的起源有关

R1.3。(元)数据达到随时考虑相关领域社区标准

结论

总之很高兴看到不仅显著投资先进的光谱技术在欧洲在经济上困难的周期,而且光谱数据的长期未来也的最前沿的那些幸运地获得这种支持和他们的策略的一个关键的推动者,我们有信心,他们未来的成功。bdapp官方下载安卓版

引用

  1. n Ogrinc Potocˇ尼克,t门,m·贝克尔. Heeren S.R.埃利斯,“利用有利的,不稳定的矩阵通过下一代高速matrix-assisted激光解吸/电离飞行时间成像采用扫描激光束”,快速Commun。质量范围。29日,2195 - 203 (2015)。doi:http://dx.doi.org/10.1002/rcm.7379
本文率
没有票
技术:
Baidu
map