仪器智能的进步——利用人工智能实现数字化转型
引言实验室工作流程正在快速变化,以跟上当今快节奏的世界。因此,产品和人员也必须适应,不仅要提高生产力,还要消除人为错误和工艺变化引起的异常或不一致。主要挑战包括要求越来越复杂的质量控制来抑制错误,结合先进的分析来获得有意义的信息或可靠的诊断。数据再现性也至关重要,因为在再现和验证结果方面的失败威胁到科学研究的完整性和声誉。自动化必须与人类的专业知识相结合。仪器智能可以在许多方面提供帮助。例如,取决于数据的性质以及获取和存储数据的过程。关键资源是实施基于机器学习和统计数据分析的工具,该工具可用于突出显示异常值或可疑值序列,识别不同数据源和数据模式的不一致性,并通过自动填写缺失值或指出应收集更多数据的位置来减少测试次数。本电子书概述了仪器智能解决方案,并展示了如何修改几个实验室部门,以实现更快、无错误的生产。这尤其可以通过数字化和数字化转型来实现。本电子书的内容包括威利的著作《实验室的数字化转型》的摘要,该书讨论了与人工智能(AI)在实验室转型中的作用相关的机遇、需求和挑战,生物医学研究中“工业”革命的一篇文章的摘要,以及安捷伦智能反射工作流工具的信息图。一、生物医学研究的“工业”革命——数据爆炸和再现性危机促使实验室工作流程发生变化有几个因素正在推动生命科学实验室组织工作流程的方式发生深刻变化,无论是医学诊断还是基础研究。这些变化的一个常见原因是生成的数据量激增,同时数据生产成本快速下降。这需要越来越复杂的质量控制来抑制错误,并结合先进的分析来获得有意义的信息或可靠的诊断。对实验室工作流程造成变化的另一个挑战是再现性,这一点至关重要,因为重要结果的再现和验证失败威胁到生物医学研究的完整性和声誉。深度学习和自动化深度学习(DL)的兴起越来越要求产生准确的数据集,以避免偏见和错误结论。反过来,这需要更多地使用自动化来消除由人为错误和过程变化引起的异常或不一致。例如,批量效应——这会破坏DL工作——在没有自动化的情况下会变得更糟。可以减轻批量效应的算法通常使用某种形式的贝叶斯推理,该推理比较不同条件下的实验结果,以过滤与过程相关的不一致性。然而,这些算法也可以消除生物学上显著的变化。不断增长的自动化从一开始就消除了批量效应的许多原因,从而为DL的强大应用奠定了基础。链接不同的专业知识尽管如此,工作流的挑战并不局限于自动化和数据分析。更大的问题在于协调自动化与人类专业知识,特别是在诊断实验室。随着全基因组测序(WGS)和全外显子组测序(WES)的出现,对帮助临床医生有效利用计算能力的新技术的需求变得更加迫切。为了克服诊断瓶颈,已经开发了能够识别数百种与罕见遗传病相关的突变的扩大的携带者筛查小组。这些小组可以发现否则无法检测到的突变,这就是机器和人类之间的整合变得重要的地方。工作流和人工变化实验室的工作方式将发生根本性的变化,正如安捷伦科技公司(Agilent Technologies)最近的一项举措所表明的那样。安捷伦技术公司是实验室工作流程分析工具和软件的专业开发商,于1999年由惠普公司(Hewlett-Packard)分拆而成。Frost&Sullivan开展的一项研究中,根据来自中国、德国、印度、韩国、瑞士、奥地利和美国的650名实验室经理、主任和主管的回答,他们的第一次制药实验室领导者调查结果于2019年6月公布。安捷伦高级副总裁兼首席技术官达琳所罗门(Darlene Solomon)表示,研究结果已经导致实验室设备发生了变化。她说:“85%的受访者告诉我们,他们正在购买更精密、更具特异性的仪器。”。所罗门补充道,工作流程的压力,以及实验室技术人员技能水平的变化,都推动了更易于使用和培训需求的减少。所罗门说:“我们有一些例子表明,一个看似微小的改变,例如使用带有触摸屏的仪器,确实有助于提高使用和训练的便利性。”。“这一点很重要,因为一些地区的实验室技术人员的形象已经发生了变化。虽然几年前,实验室技术人员可能是具有质谱或气相色谱专业教育的理科毕业生,但如今,他们很可能是具有人文学科学位的多面手,这意味着实验室管理人员希望仪器易于使用、易于培训,以及不需要由专家操作。”另一个主要趋势是人工智能(尤其是DL)的日益融合,以适应实验室中复杂或重复的任务。所罗门说:“基于深度神经网络的现代人工智能方法在基于组织染色的数字病理学领域尤其有前景,可以提高癌症诊断和治疗决策中病理切片解释的准确性并降低其复杂性。”。“例如,人工智能可以提高效率,提高计算细胞等耗时任务的准确性,或者识别高级细胞染色产生的复杂模式的准确性,这些模式可能会让人工解释感到困惑。”所罗门强调,需要可靠的数据来为DL算法提供数据,并强调了整个工作流程一致性的重要性。“样本分析总是从样本准备开始。良好和一致的样本准备是迈向自信和高质量结果的一大步,这将在后端产生有意义的理解,”她解释道。解决治理和道德问题安捷伦调查范围之外的工作流程还有另一个维度,即激励和道德考量的作用,以确保一致和公平的结果。马拉维大学公共卫生和流行病学教授亚当森穆拉强调了这一点。他解释说:“如果没有适当的系统,即使是最好的设备也无法发挥最佳作用。”。“也许我们也可以采用约瑟夫姆富索本戈(Joseph Mfutso Bengo)的LEGS(领导力、道德、治理和系统)模型。”穆拉指的是马拉维为加强卫生系统而开发的名为LEGS的框架,特别是在治理和法治相对薄弱的发展中国家[1]。根据LEGS研究的作者,道德规范会在各个层面,如采购、临床工作和研究,加强内部社会控制。提高再现性虽然临床需要一致性和准确性,但再现性已成为基础研究和转化研究的一大挑战。无法再现结果的主要原因之一是当正面结果比负面结果更受青睐时,发表偏见。还有一种被称为HARKing(结果已知后假设)的现象,研究人员呈现出意想不到的结果,就好像他们从一开始就被假设了一样[2]。虽然并非所有研究人员都同意HARking完全不利于科学进步,但这其中存在不诚实的因素,更重要的是,它可能会带来偏见,因为该假设可能只是从结果中推断出的几种假设中的一种。一种解决方案是再次改变工作流程,在进行实验之前预先注册工作计划和假设,以避免选择性报告或HARking。英国布里斯托大学生物心理学教授马库斯穆纳夫(Marcus Munafò)是感兴趣的研究者之一,他研究与酒精和药物滥用相关的神经通路。Munafò博士毕业后,在进行了系统回顾和荟萃分析后,发现许多发现不如看起来可靠时,他对工作流程和再现性之间的联系产生了兴趣。他解释道:“我对我们的激励结构和工作方式有何贡献感兴趣。”。“现在,我有兴趣思考如何改进我们的激励结构和更广泛的研究文化,以关注质量,至少与创新、新颖性和发现一样多。在过去几年中,我们朝着开放的研究工作流程迈进。我们从预注册研究协议开始,现在我们定期归档数据,我们开始归档用这些分析脚本,我们发布所有手稿的预印本。最初,这仅用于赠款资助的活动;现在是我们所有的活动,包括学生项目。”Munafò补充道,在这一正在进行的过程中,还有更多的工作要做,比如分享更多的研究材料。他说:“这有几个好处——它允许对我们的工作进行更严格的审查,并为内部检查提供了激励。”。根据Munafò的说法,最大的挑战是在研究人员中灌输长期观点,并清楚地阐明其益处,以便团队成员认同所需的努力。这与马拉维LEGS项目传达的信息一致,其基本主题是,研究的动机需要围绕科学和数据而不是希望和愿望引导的一致性和透明度进行重新调整。这几乎是对人性本身的挑战。References[1] Mfutso-Bengo, J., Kalanga, N., and Mfutso-Bengo, E.M. (2018) Proposing the LEGS framework to complement the WHO building blocks for strengthening health systems: One needs a LEG to run an ethical, resilient system for implementing health rights. Malawi Med. J., 29 (4), 317.[2] Kerr, N.L. (1998) HARKing: Hypothesizing After the Results are Known. Personal. Soc. Psychol. Rev., 2 (3), 196–217.[3] Hunter, P. (2020) The “industrial” revolution in biomedical research. EMBO Reports 21, e50003.二、人工智能(AI)改造实验室数字化正在我们的工作和日常生活中蔓延,从纸张到数字不仅仅是改变存储数据的媒介。本文讨论了与人工智能(AI)在改造实验室中的作用相关的机遇、需求和挑战。实验室的数字化在某些领域比其他领域更快,这取决于从纸面向数字化转变的需求和机会。Al可以作为过程中的催化剂,提供一系列附加服务,包括健全性检查、异常值检测、数据融合和数据预处理阶段的其他方法、数据分析和建模的不同方法、数据消耗监测和实验室中的其他动态过程,以及对领域专家的决策支持(图1)。图1。从数据预处理和来自不同来源的数据融合到数据分析和不同过程的监控,AI可以在不同方面支持实验室。资料来源:Dunja Mladinic提供。数据预处理和数据分析根据数据的性质、获取和存储数据的过程或其他一些数据属性,Al方法可以以不同的方式帮助数据预处理。例如,我们可以有一个基于机器学习和统计数据分析的工具来突出显示异常值或可疑值序列,识别不同数据源和数据模式的不一致性,并通过自动填写缺失值或指出应收集更多数据的位置来减少测试数量。如今,Al方法能够高效组织大量异构数据,支持高效搜索和检索。除此之外,根据数据形态,可以为用户提供强大的数据探索工具,包括丰富的数据可视化、自动异常值检测、数据建模和预测。此外,数据分析可以应用于实验室工作的不同阶段,从监测和指导数据收集、数据预处理、存储和建模到搜索历史实验室数据(例如,测试结果和笔记本),并使科学家能够跨问题和实验室共享数据和模型。过程监控实验室中的过程涉及可能从监控和建模中受益的活动和数据。我们讨论的是一个过程或一组可能相互关联的过程的动态和结果建模。历史数据可用于建立一个参考模型,该模型可根据监控过程的当前背景和趋势进行调整。由于Al方法用于构建机器、物流流程或生产工厂的数字孪生,因此它们也可用于构建实验室中某些流程的数字孪生。这将有助于监控相互依赖性、可能的异常检测以及对流程未来发展的模拟,使专业人员能够提出假设问题。通过对输入数据进行实时建模和监控的能力,我们可以在同一实验室内或不同实验室内分析数字实验室笔记本。以类似的方式,由于机器学习方法已被用于数十年的研究出版物中,以预测科学中的下一件大事,[1]人们可以分析和监控实验室中的过程和数据流。人类在回路中无论我们在实验室中使用了多少以及在哪些过程中使用了人工智能,我们都应该记住,人工智能可以涵盖一些智能,但人工智能无法涵盖人类给过程带来的其他维度,在采取行动之前预测行动的后果,并制定实现目标的策略。智力与清晰、专注和有选择的思维有关,需要我们的指导,以避免迷失在细节或幻想中。根据瑜伽哲学,智慧是实现人生成功所需的三种创造力之一:意识、智慧和能量。[2] 例如,为了知道我们想要表现什么以及如何表现,我们需要资源/能量来真正做到这一点;要知道要展示什么和拥有资源,我们需要一个策略。人类通过有意识地决定某些工作或实验室实验的目标,智能地制定实现目标的策略,并利用资源来实施策略和实现目标,在这一过程中发挥着至关重要的作用。References[1] Lawton, G. The next big thing in chipmaking. Computer (Long. Beach. Calif). 40, 18–20 (2007).[2] Mladenic, D. Artificial Intelligence (Al) Transforming Laboratories. in Digital Transformation of the Laboratory 289–295 (Wiley, 2021). doi:10.1002/9783527825042.ch21.原文:Advances in Instrument Intelligence——Using AI to Achieve Digital Transformation供稿:符 斌,北京中实国金国际实验室能力验证研究有限公司