安东尼·n·戴维斯a、b
和罗伊·Goodacrec
一个专家能力,测量和分析科学,Nouryon代芬特尔、荷兰
b国家电力、可持续环境研究中心、教师的工程和科学计算,英国南威尔士大学
c生物化学系、综合生物学研究所、英国利物浦大学。
电子邮件:(电子邮件保护)
在最近的皇家化学学会的,法拉第讨论会议在爱丁堡挑战分析复杂的天然混合物我发现自己不知道的力量我们现代光谱仪研究带来的高度复杂的系统有时会压倒我们周围的自然怀疑穷采样实践。1一些有针对性的问题将由罗伊Goodacre在这个方向上几个演讲者似乎表明我在担忧并不孤单,所以我想这可能是值得一看的诱惑和一些好的做法。
我的光谱仪已确定30000个独立的化学实体为什么我需要八个复制样品吗?
普通读者所知,本专栏不旨在成为蓄意挑衅(!),但作为我们分析光谱和光谱工具箱变得越来越强,总是有一种诱惑,让陶醉在最新的高分辨率增强的荣耀的忘记,只是一会儿,为什么我们在第一时间进行实验。在组学实验的世界更重要的是确保我们生产的结果拍字节是健壮和定制。如果我们撇开仪器的成本,sloppyomics的社会成本随着更多数据变得公开供其他科学家使用,可能导致得出错误的结论和资源被转移显然有前途的死角。我们是由乔治邮政提醒他的编辑在2011年“带来生物标记”2,当时,在文献中描述的150000个临床生物标志物仅100人常规应用于临床。
组学实验本身存在一个巨大的问题古典统计学家通过他们巨大的维度。传统的看法是,问题的维数越大,越大的独特无关样品你需要如果你想成功地分析问题。但组学方法的承诺在哪里唱响亮也总是很困难的地方招募大样本人群。
在医疗保健环境中,组学被认为是一个关键的分析光谱的进步将形成个性化医学的主干。然而,不一致的伦理委员会,医生病人笔记和一个简单的缺乏足够的病人参与试验是相同的性别,年龄,体重(或BMI),民族起源、饮食、饮酒、健身政权、病史等人,例如,在同一阶段的非小细胞癌,这种方法很可能影响到未来。让我们甚至开始讨论需要健康对照组相同的特征,甚至徘徊的分析雷区比较持续的监控对抓取采样结果和采取不同的项目不同的存储策略。我们不要忘记,在大多数病例对照研究病例与某种形式的疾病(那些)通常已经在药物(或自我治疗),这强烈的混合因素也需要考虑。
有一个巨大的差距提供理论的相关性,以期找到因果关系从培养皿的细胞培养的研究抓住适合患肺癌,塑造45岁的工程师之前,他开始咳血进他的手帕。
所以它真的适合在这样的环境中忽略我们所有良好的抽样实践这是灌输给美国大学(希望如此),全力以赴为尽可能多的数据,我们可以和(伦理委员会愿意)一直把质谱、核磁共振(NMR)数据集和离子迁移指纹到一大堆的统计学家争论吗?相比几年前Raji Balasubramanian和同事一些分类算法用于组学的光谱技术驱动的高维数据。3劳伦·麦金太尔去年看着缺少样品的复杂性相比代谢物/基因和过拟合缺乏承认在文献中提出一个稍微不同的两阶段方法,数据分析的挑战。4Drupad Trivedi最近和他的同事们调查了代谢组学文献,发现绝大多数的研究都是不幸的是动力不足。5今年年初,吴邦国和合作者发表的“选择性”审查在集成来自不同类型的组学实验的数据需要添加另一个层面的复杂性他们的生活!6因此任何研究的必不可少的组件生成megavariate数据是需要减少错误发现。7
如果是这样,那么究竟应该如何继续说服政府资助机构,它是明智的将资金投入这些方面的研究从长远来看吗?那些热情的医疗光谱学领域相信在这种方法中,半岛综合体育官方APP下载德甲需要回答这个问题每三到五年关于你上次项目节省了多少生命?(就像那些接近下一个英国研究卓越框架将不得不考虑…)。也许最好的方法是记住所有这些问题设计实验时首先作为下一个故事。
研究自然灾害的影响后,组学
(东北医疗(TMM)项目创建操作前瞻性群组研究在日本地区的人口受东日本大地震影响2011年3月11日。8项目的核心欲望支持个性化医疗支持此次地震地区的未来。大量的想走进这multi-omics研究可以一直追溯到抽样程序。两个队列研究讨论了一种成人学习和第二个出生和三代学习超过150000名参与者被招募了从2013年到2017年。每个参与者的分子分析是重要的遗传和环境因素。生物分析中心执行标准一道质谱(MS)和核磁共振分析数据提供给科学界。
作者讨论了在进行样本收集困难组学群基因组研究虽然不会改变,目标代谢产物可能是不稳定的,会受很多因素的影响,必须捕获时取样。事实上,他们让漂亮的语句组学数据的质量很大程度上取决于收集的样品的质量。他们研究了哪种类型的血液采集程序是最好的组学研究决定,这是最好的收集EDTA等离子体,如蛋白质和代谢物可以在血清凝血不稳定。然而,与其他实验室保持一致,他们决定继续收集血清和血浆样本。图1显示了队列的样本收集和运输计划招聘网站“生物银行”。
图1所示。TMM群样本收集和存储协议。
TMM中央实验室协议为蛋白质组和代谢组分析
蛋白质组分析,TMM团队进行质/女士测量等离子体的一式三份样品后已经变性,减少和烷基化消化和改用低盐紧随其后。不幸的是,这些研究把每样一个多小时,显然会导致问题,这个规模的项目。
代谢物分析他们采取了一道的方法使用核磁共振和正面,负离子模式质。
代谢物从血浆样本中提取到一个钠磷酸盐缓冲剂NMR研究在600 MHz仪器收集标准1 d NOESY和CMPG光谱成功地识别和量化37代谢物。女士的分析,一个自动化的样品制备机器人使用这种过程大约每小时100样品,检测超过1000的峰值和识别250种代谢物。正离子模式分析,研究小组使用了一个UHPLC QTOF / MS系统喷雾电离作用和C18柱(Acquity高速钢T3;水)是用于LC分离。负离子模式下,NANOSPACE SI 2高效液相色谱法(资生堂、东京)和Q Exactive Orbitrap系统部署使用HILIC柱分离(珠海pHILIC;Sequant,达姆施塔特)。女士测量可以在四个每小时。
样品质量控制代谢物的分析
不满意的水平采样标准化和分析上面所描述的那样,该小组还放协议并非不合理的假定,会有一些样品处理错误处理这样的大型研究。样本排除异常值如果NMR数据范围之外的某些控制代谢物的预期。例如,血糖值需要不低于70%的,衡量一个原始血液测试进行招聘网站和乳糖含量不能超过2×标准差的队列的平均水平。样品也被排除,如果他们违反了某些方面的协议,如意外长时间存储,在进入“生物银行”。
最后,质量控制数据被提供在日本jMorp多组学参考面板https://jmorp.megabank.tohoku.ac.jp/201905/和8可以看到jMorp释放201905 5 kjpnv2基因型频率的数据集从3500个人。代谢物数据库发布(ToMMo代谢组2018 20180827)目前包含代谢物浓度由NMR的分布,峰值强度的分布和代谢产物的特点是质样本中发现最初的10719名志愿者(但是到目前为止只有3012人)。
对于那些感兴趣的读者如何使用质量控制在代谢组学导演的一篇文章代谢组学获得今年的奖最下载证明,许多研究人员都知道,质量保证和质量控制是任何大规模的组学研究的一个非常重要的方面。9
结论
TMM的项目如此,作者自称是最大的一个计划multi-omics正在进行的纵向研究,很明显,那些负责项目的计划和执行肯定是认为抽样是对整个组学工程的质量至关重要。时间会告诉我们,如果他们采取了足够的预防措施,增加数据集大小和分析科学家开始使用个性化医学的资源来支持部署到这些地区。
引用
- http://www.rsc.org/events/detail/29574/challenges-in-analysis-of-complex-natural-mixtures-faraday-discussion(2019年6月10日访问)。
- g .邮政”,带来生物标记”,自然469年,156 - 157 (2011)。https://doi.org/10.1038/469156a
- 郭y, a . Graber雷诺数,麦克伯尼和r . Balasubramanian”样本大小和统计能力考虑在高维数据设置:分类算法的比较研究”,BMC生物信息学11日,447 (2010)。https://doi.org/10.1186/1471 - 2105 - 11 - 447
- A . Kirpich电子艺界安斯沃思,J.M. Wedow J.R.B.纽曼,g . Michailidis L.M.麦金太尔,“变量选择的组学数据:一个实际的评估小样本大小”,《公共科学图书馆•综合》13 (6),e0197910 (2018)。https://doi.org/10.1371/journal.pone.0197910
- 位Trivedi·r·Goodacre和好莱坞的“代谢组学为大众:代谢组学在一个个性化的世界的未来”,欧元。j·摩尔。中国。地中海。3,294 - 305 (2017)。https://doi.org/10.1016/j.nhtm.2017.06.001
- f . c . Wu, j . Ren x, y江和马,“选择性的多层次的组学数据集成使用变量选择”,高吞吐量8 (1),4 (2019)。https://doi.org/10.3390/ht8010004
- 是否布罗德赫斯特和D.B. cooper凯尔统计在代谢组学策略来避免错误的发现及相关实验”,代谢组学2,171 - 196 (2006)。https://doi.org/10.1007/s11306 - 006 - 0037 - z
- s . Koshiba Motoike, d . Saigusa j .井上m .冻干y Katoh, f . Katsuoka Danjoh, a . Hozawa s栗山n .象美吉诗m .长崎t . Takai-Igarashi s Ogishima n .保险丝吴市,g .田宫o .田边,j . Yasuda k .山本木下光男和m .“组学研究项目的前瞻性群组研究东北(医疗项目”,基因的细胞23 (6),406 - 417 (2018)。https://doi.org/10.半岛app应用下载1111/gtc.12588
- d·布罗德赫斯特r . Goodacre S.N. Reinke, j . Kuligowski身份证威尔逊·m·刘易斯和b邓恩,“指南和注意事项使用系统适用性和质量控制样品的质谱分析应用于诸多临床代谢组学研究”,代谢组学14日,72 (2018)。https://doi.org/10.1007/s11306 - 018 - 1367 - 3