安东尼·n·戴维斯
国家电力、可持续环境研究中心、学院计算、工程和科学,英国南威尔士大学
DOI:https://doi.org/10.1255/sew.2023.a3
©2023年作者
发表在Creative Commons BY-NC-ND执照
我最近反映生活是非常不公平的,尤其是如果你是一个光谱。我看不起这取死的身体光谱仪和反映多少热心热情的年轻研究人员之间,与曾经是一个先进的科学的复杂性不知道现在减少到回收的问题,处理和潜在的污染风险。
多少现在建立了科学家们已从这分光计的儿童受益,优秀的光谱数据集,这是产生在鼎盛时期的能力。他们制作的基因组,从这些数据帮助一下他们的上司(毫无疑问,有时微妙的数据处理),他们的论文和出版物——护照现在建立事业。但所有这些数据现在在哪里?(图1)。
图1所示。有很多方法光谱数据集可以“死”。
奇怪的是我们很幸运参加里克韦克曼音乐会在伦敦,包括一个非常好评引渡他著名的“亨利八世的六个妻子”。这让我想起了我的女儿最喜欢的助记符唱“离婚,斩首,死亡,离婚,斩首,活了下来“通常用来记得阿拉贡的亨利八世的六个queens-Catherine的命运,安妮·博林,简西摩,克利夫斯的安妮,凯瑟琳·霍华德和凯瑟琳帕尔。但大家都知道谈话有时会奇怪,同样的记忆突然似乎非常相关的各种常见的命运我们光谱仪的数据集。
图2。这提醒你的研究生导师吗?如果是这样,当心!照片173782772©Spiroview Inc . | Dreamstime.com
出生的光谱数据集
最初交付光谱仪是能产生一些最好的数据集的我们所能衡量。良好的信噪比和非常稳定的校准。相关计算机硬件有点背后的最先进的,但是这很正常因为长仪器硬件的开发时间。许多专家的手中,和一些专家,科学家,这个美妙的光谱仪生了许多光谱数据sets-reinforcing理论和消除一些神话。对其寿命作为一个优秀的测量平台允许许多修改原来的基本设备。因此,尽管我们的数据是年轻没有问题。所有测量参数存储的数据集,我们可以检查仪器被正确设置。在适当的评论被写入数据文件,我们甚至可以看到背景进行补偿。然而,生活变得更复杂更高级的数据处理时所需的原始谱仪控制电脑上是不可能的。
离婚了
早期的尝试开展更具冒险精神的数据处理要求光谱仪的数据移动电脑。我们很幸运,有一个数据导出功能构建到光谱仪软件和我们能够至少x - y数据点在第二个电脑。即使有一个数据交换格式部署到光谱仪等JCAMP-DX标准,我们没有得到所有的信息到新电脑上。因为标准只需要最少的信息需要准确的数据处理出口作为一个兼容的要求条件。所有的附加元数据从原始谱仪系统可以定义兼容的方式转移,但前提是供应商认为这是个好主意。在大多数情况下这离开了光谱数据与元数据的光谱被最初测量和分光计的死亡任何复苏的希望从这个离婚了。
斩首
我们成功地建立工作流将孩子们从生育光谱仪和计算机硬件更高级的数据处理的能力。然而,大多数的商业数据处理软件包,并且仍然是不能维持的完整性在导入光谱数据集,例如,化学计量学包数据。即使在化学计量学软件供应商实现了文件过滤器直接进口光谱仪的本地文件格式的标题信息留下非常频繁。所以,支持元数据的光谱本质上是斩首。
死
通常离婚或斩首光谱仪是幸运的孩子。许多珍贵的光谱已经死亡,不仅仪器测量他们退休时,也当供应商执行系统upgrade-sometime完全替换上一个工作的控制计算机完全不同的操作系统。这意味着原来的本地二进制格式文件的早期作品不再是可读的。在一个乐器早期试图满足FDA指南数据完整性,我们经验丰富的原始数据文件被嵌入到另一个二进制包装提供电子签名能力证明没有数据操作。那里唯一的问题是,充分验证FDA-compliant准备数据迁移软件这种光谱仪一无所知的自制的额外的包装,只是未能读谱。在这种特定的情况下我们还是很幸运的获得一些IT团队谁梦见这“节约成本”的一次性的解决方案,可以鼓舞的“死亡”光谱可能比原来花费更多的努力来衡量他们!
离婚了
现在再往下看数据的发布和开发途径,我们可以看到,一些刊物向作者提供的机会提供有关光谱数据一起提交的手稿。这些开创性的出版物有不幸的是很少或没有指导或提出的光谱数据是如何上传。事实上,教授罗伯特·兰开夏郡最近遇到一些指导一个期刊,有限的数据量可以存放几MB。
IUPAC FAIRSpec项目团队在最近的一次会议,他们还建议,只有少数的强制限制上传选中的例子光谱(通常是最好的测量而不是“典型”对于任何给定的实验)也都属于离异甚至已经遭受中世纪的酷刑/执行完整的实验数据集的类别的解体与相关的关键的上下文。1
斩首
在第二个斩首类别我决定提到一个例子,用户或供应商进行最初是什么样子的一个有用的解决软件问题,带来意想不到的后果。光谱仪的软件行业的工作我有经验的销售人员销售软件特性的痛苦,只存在在纸上或者只有在长期规划会议和讨论还没有达到的阶段把写在纸上。如果销售成功这些项目通常导致非常匆忙的绝对最小数量的实现特性改进履行合同的义务。这是从来没有一个伟大的方式来开发健壮的软件,经常遭受意外后果定律!幸运的是,这不是常态。
一个例子,而不是任何人我有工作,涉及一个仪表工程师有困难解决一些相对较小的问题与乐器的一个重要客户的网站。他们决定尝试使用光谱仪的软件的一个版本,他们已经被测试和收集潜在客户的反馈。然而,新版本从未打算让手中的真实,活的顾客!有点令人惊讶的是这个固定的具体仪器关键账户有问题,和所有快乐…一段时间。
当下一次定期更新显然是由于关键客户收到升级,惊恐地发现,所有测量的光谱数据在过去的12个月将不再负担。不幸的是工程师和重要客户,未发表的评论复制该软件还包括一个实验性的、创新的新数据存储概念,没有预发布测试阶段,供应商又变成老试、可信存储文件格式。这个真正的斩首归档数据和花费大量的钱来恢复。我甚至不打算尝试讨论合规和数据完整性问题引发了这样的错误。
活了下来
怎么我们的光谱仪的孩子模仿凯瑟琳帕尔和生存所有潜在的缺陷在他们的预期寿命?嗯,很多问题的答案仍躺在公平原则和分析实验室中如何实现它们。的起点肯定会分配所有光谱数据集在出生时持久的唯一标识符(公平原则F1。(元)数据被分配一个全球独特的和持久的标识符和F3。元数据清晰、明确地包含了数据的标识符描述]。这将使生活更容易为研究人员、主管、组长、出版商和监管者。即使,在数据集的生命周期,是分开的一些关键元数据,只要唯一标识完好无损数据考古学家总能恢复相关的元数据。
目前可能是一厢情愿的想法,但如果我们观察的许多问题突出显示在上面的列中,保持可用的元数据可以解决的许多问题通常与过早死亡的有关数据set-Accessibility本金A2。元数据访问,即使不再可用的数据。如果正确实现意味着它总是可以设想元数据恢复正如上面所讨论的。
在数据集的一生将通过许多不同的软件系统,而不是每个剥离的元数据,它不需要特定的这样的项目最优化软件只对进口x - y数据和忽视其他metadata-it应该可能最初的元数据是保留有自己的起源和新的加工应该只添加新的元数据完全描述,也许像一个兼容的审计跟踪,已开展的行动与光谱数据。这样后续研究者的繁殖能力的科学作品发表在《文学将会增强。我们都需要站在巨人的肩膀上,牛顿的著名的隐喻坦白,2但仍有太多这属于出版杂志不能复制的结果!
最后,很明显,我们上面所讨论的,过早死亡的法医调查的光谱数据集,围绕滥用,诅咒,mis-deployment和不当的光谱和一般科学数据处理软件。因此,有趣的是出版的科学公正的原则软件(FAIR4RS)在2022年底。3不幸的是,没有数据集或软件代码发表与论文尽管它引用三个软件示例声称遵循FAIR4RS原则价值后你应该感兴趣。3
在结束比引用据称是来自伟大的国王,”所有的损失,时间是最irrecuperable永远无法救赎”。所以,我们不要浪费时间产生光谱与人为的短暂的一生中,让我们完成这个FAIRification科学数据!
引用
- https://www.oxfordlearnersdictionaries.com/definition/english/dismemberment
- 牛顿,艾萨克·牛顿爵士的来信,罗伯特胡克。宾夕法尼亚州的历史社会。https://digitallibrary.hsp.org/index.php/Detail/objects/9792
- m·巴克N.P. Chue香港,科学博士卡茨A.-L。lamprech, c . Martinez-Ortiz f . Psomopoulos j .耙l·j·卡斯特罗,m . Gruenpeter P.A.马丁内斯和t . Honeyman“引入公平原则研究软件”,科学。数据9日,622 (2022)。https://doi.org/10.1038/s41597 - 022 - 01710 - x

托尼•戴维斯
托尼·戴维斯是一个长期存在的半岛综合体育官方APP下载德甲光谱学欧洲bdapp官方下载安卓版列编辑器和认可的思想领袖在标准化和法规遵从性在工业和学术营地一英尺。他花了他的大部分工作生活在德国和荷兰,作为首席科学家最近,战略研究小组,测量和分析科学在荷兰阿克苏诺贝尔公司/ BV Nouryon化学物质。强烈主张开放创新的正确使用。0000-0002-3119-4202
(电子邮件保护)