PSP管道概述。基因组测序后,确定了初级氨基酸序列
克利夫兰诊所和IBM的研究人员最近在《化学理论与计算》杂志上发表了研究结果,为将量子计算方法应用于蛋白质结构预测奠定了基础。
几十年来,研究人员利用计算方法来预测蛋白质结构。蛋白质将自己折叠成一种结构,这种结构决定了它如何发挥作用,并与体内其他分子结合。这些结构决定了人类健康和疾病的许多方面。
通过准确预测蛋白质的结构,研究人员可以更好地了解疾病是如何传播的,从而开发出有效的治疗方法。克利夫兰诊所博士后Bryan Raubenolt博士和IBM研究员Hakan Doga博士领导了一个团队,研究量子计算如何改进当前的方法。
近年来,机器学习技术在蛋白质结构预测方面取得了重大进展。这些方法依赖于训练数据(实验确定的蛋白质结构的数据库)来进行预测。这意味着它们被教给识别的蛋白质数量所限制。当程序/算法遇到突变的蛋白质或与它们所训练的蛋白质非常不同时,这可能导致准确性降低,这在遗传疾病中很常见。
另一种方法是模拟蛋白质折叠的物理过程。模拟可以让研究人员观察给定蛋白质的各种可能形状,并找到最稳定的形状。最稳定的形状对药物设计至关重要。
挑战在于,这些模拟在经典计算机上几乎是不可能的,超出了一定的蛋白质大小。在某种程度上,增加目标蛋白的大小相当于增加魔方的尺寸。Raubenolt博士说,对于一个含有100个氨基酸的小蛋白质,一台经典的计算机将需要相当于宇宙年龄的时间来彻底搜索所有可能的结果。
为了帮助克服这些限制,研究小组应用了量子和经典计算方法的混合。这个框架可以让量子算法解决对最先进的经典计算具有挑战性的领域,包括蛋白质大小、内在无序、突变和蛋白质折叠中涉及的物理学。与最先进的经典方法相比,通过在量子计算机上准确预测寨卡病毒蛋白质小片段的折叠,该框架得到了验证。
量子-经典混合框架的初步结果优于基于经典物理的方法和AlphaFold2。尽管后者被设计用于更大的蛋白质,但它仍然证明了该框架在不直接依赖大量训练数据的情况下创建准确模型的能力。
研究人员首先使用量子算法对碎片主干的最低能量构象进行建模,这通常是计算中最需要计算的步骤。然后使用经典方法转换从量子计算机获得的结果,重建蛋白质及其侧链,并使用经典分子力学力场对结构进行最终细化。
该项目展示了一种将问题分解成部分的方法,量子计算方法解决一些部分,经典计算解决其他部分,以提高精度。
“这个项目最独特的地方之一是涉及学科的数量,”Raubenolt博士说。“我们团队的专业范围从计算生物学和化学、结构生物学、软件和自动化工程,到实验原子和核物理学、数学,当然还有量子计算和算法设计。我们利用这些领域的知识创建了一个计算框架,可以模拟人类生命中最重要的过程之一。”
该团队将经典计算方法和量子计算方法相结合,是推进我们对蛋白质结构的理解以及它们如何影响我们治疗和预防疾病的能力的重要一步。该团队计划继续开发和优化量子算法,以预测更大、更复杂的蛋白质的结构。
Doga博士说:“这项工作是探索量子计算能力在蛋白质结构预测中发挥优势的重要一步。”“我们的目标是设计量子算法,找到如何尽可能真实地预测蛋白质结构的方法。”