自20世纪中期核磁共振(NMR)原理被发现以来,科学家已通过利用该技术获取分子的丰富结构信息,实现了多项重大的科学突破。在技术创新的驱动下,核磁共振技术不断进步,给我们带来了新的功能和增强的工作流。
然而归根结底,世纪之交以来计算能力的快速扩展——尤其是人工智能(AI)、机器学习(ML)和深度学习的应用,为核磁共振技术的最新发展奠定了基础。
在核磁共振等需要使用复杂计算和数据的领域,这些技术的先进分析能力尤其有用。它们让科学家能够将复杂耗时的任务予以自动化,从而提高核磁共振方法的效率。
计算技术的指数级扩展
得益于计算技术的指数级扩展,人工智能(AI)和机器学习(ML)迅速应用于多个学科之中。这些技术进步正在改变科学家获取和分析数据的方式。
许多机器学习方法——包括统计增强、模拟退火和主成分分析,构成了当前及未来核磁共振研究图景的组成部分。目前,研究人员正在研究人工智能和机器学习在信号处理、基线/相位校正、峰值检测、分配、复杂混合物分析、量子力学(重述密度泛函理论)和结构测定/预测中的应用。这是一项复杂的研究,其中的一些步骤虽简单却存在误导性。
“您所了解的所有超级性能都是通过一个看似简单的方法来实现的,”斯坦福大学的David Donoho教授解释道:“第一步是获取相关的海量数据。第二步是制定一项具有挑战性的任务,若得到解决,它将有助于投入应用。第三步是走出去,了解其他人的深度学习模式。第四步是疯狂地进行修补。实现这一切的前提条件在于——能够利用高度先进的计算技术来获取结果。”
核磁共振波谱分析方面的深度学习
相位和基线校正是核磁共振波谱分析中的重要处理步骤,在过去,科学家开发了许多不同的方法来自动执行这些任务。这些方法通常能发挥有效作用,但在应用于高信号密度的波谱(例如,质子波谱)时,许多方法会受到不利影响。在识别和分割这些任务方面,深度学习表现出优异的效果。在核磁共振波谱领域,该技术已被用于帮助用户进行谱图处理和解释。
近期,布鲁克的一支科学家团队采用了一种用于1D 1H NMR波谱的相位和基线校正的深度学习方法。目前,用户可从布鲁克的TopSpin软件(4.1.3)中获取这一算法。该算法为低场和高场波谱提供了一致的、更优的相位和基线校正,并且在相位校正精度方面甚至达到人类水平的质量结果。这一新方法标志着全自动核磁共振波谱分析的进一步发展,提供了一种更稳健的相位和基线校正方法,适用于布鲁克新款Fourier 80高性能台式核磁共振系统以及布鲁克高场NMR波谱仪。
信号区域检测是核磁共振波谱分析中的常规任务,也是一直以来需要手动执行的少数处理步骤之一。然而,布鲁克的科学家开发了一种用于1D 1H NMR波谱中信号区域检测的深度学习算法。该算法让宽基频范围内获得的波谱达到极高的精度,而无需用户输入任何信息,因而有能力在很短的时间内达到甚至超过人类水平。这些技术有可能实现核磁共振波谱所含信息的全自动提取和分析。
利用人工智能,突破信息瓶颈
然而,随着这些研究变为可能,我们遇到了一个问题——数据。“生物核磁共振技术的进步受到数据可用性和处理时间的牵制,”瑞士苏黎世联邦理工学院(ETH)化学与应用生物科学系物理化学教授兼生物核磁共振组组长Roland Riek教授透露:“首先在数据可用性方面,值得注意的是,在利用核磁共振研究的数千种蛋白质结构中,只有一小部分的原始数据集可供其他研究人员使用。这是核磁共振领域目前尚待解决的一个巨大问题。”
但对于第二个难题——执行核磁共振实验和分析结果所需的时间,他认为,可利用快速发展的人工智能(AI)予以解决。
“目前,”他补充道:“要将蛋白质结构完全描述出来,需要六个月到几年的时间,因为所有测量和所有数据分析任务都非常耗时,需要专家持续不断地予以判断。”他认为,这一瓶颈阻碍了该领域的进展,而解决方案又难以找到。“加快获取核磁共振数据的过程并不容易,”他解释道:“我们需要培养生物培养基并制备分析样品,而且还需要一定的时间来运行核磁共振脉冲序列,因而难以加快数据获取速度。但我们能做的是,更有效地利用核磁共振仪器方面的时间,并简化数据分析。”
Riek教授指出,人工智能为实现这两个目标提供了一条途径:“通过训练算法在生成结果时对其进行评估,然后动态地对实验步骤作出自动调整,我们便只需运行为解决结构问题而必须运行的脉冲序列,从而节省大量时间。而且,由于仪器时间成本较高,因而该过程还将节省资金。”Riek教授在这方面的研究仍处于早期阶段,但他相信,一旦初步结果公布,该方法将带来广泛的裨益。
人工智能与高分辨率仪器
当然,在上述人工智能能力的背后,高分辨率仪器日益提高的可用性也给予了推动。布鲁克一直在开发相关技术,旨在通过将高性能仪器与新的工作流软件和服务相结合,实现核磁共振领域的科学创新。
例如,布鲁克将人工智能深度学习能力集成到其TopSpin™ NMR软件之中,改善了质子核磁共振波谱中的信号检测。使用人工噪声以及公开化合物的其他伪影,模拟出200万个核磁共振波谱,并对深度神经网络进行了相应训练。这样,通过更准确地检测核磁共振信号,就会实现更轻松便捷的自动波谱分析。
布鲁克的GHz级核磁共振波谱仪及其独特的探头和软件,可帮助科学家利用核磁共振,推进功能结构生物学的研究。对于既不可结晶也不可溶的蛋白质(例如,嵌入脂质双分子层或蛋白质聚集体的膜蛋白)的结构测定,这些工具将发挥重要价值。
通过将人工智能与高分辨率核磁共振仪器相结合,核磁共振领域取得了许多科学突破。例如,在一个名为NMRtist的合作项目中,法兰克福歌德大学Peter Güntert教授(哲学博士)正在研究一种机器学习方法,以期直接通过核磁共振(NMR)实现全自动蛋白质结构测定。通过与BioNMR软件开发人员合作,让他们真正突破了核磁共振技术的发展障碍,取得了单靠核磁共振无法取得的发现。
“NMRtist的工作流涵盖从波谱,到全自动化过程中的分配和结构描述,”他解释道:“我认为到目前,端到端的全自动核磁共振结构测定是完全可能实现的。这意味着,一旦获得某种性能良好的蛋白质的测量值,那么只需几个小时即可完成分配和结构描述。”
结合先进的分析仪器,人工智能和机器学习将有潜力在各个学科中(包括一系列引人注目的核磁共振应用)激发新的科学发现。布鲁克BioSpin总裁Falko Busse博士表示:“布鲁克非常自豪能够通过我们的GHz级核磁共振解决方案,以及我们在固体核磁共振方面的最新进展,为功能结构生物学研究提供支持。在我们不断开发高价值的化学生物学研究方法的过程中,核磁共振领域给予了有力支持,对此,我们由衷地表示感谢。”