水简介

首页 » 常识 » 问答 » ICLR2023初探AI拼图模型预测蛋白
TUhjnbcbe - 2024/6/30 17:04:00

机器之心专栏

作者:ByteDanceResearch团队

分子表示学习在AI辅助药物发现研究中起着至关重要的作用。在传统药物研发中,常用的分子对接模型需要进行大量的构型采样与优化,并筛选出较为稳定的结构。这类策略效率较低,难以应用于高通量的蛋白质对接任务。本文介绍的基于分子表面黎曼流形的深度学习表示方法(HarmonicMolecularRepresentation,HMR)实现了更准确、高效的蛋白质对接模型开发。HMR用二维黎曼流形建模分子表面,结合调合分析技术与神经网络实现流形上几何、化学信号的多尺度传播和两个蛋白质表面之间的匹配度比较,进而利用「蛋白质拼图」的逻辑实现蛋白质分子刚性对接(rigidproteindocking)。实验表明,基于HMR的分子对接模型比当前深度学习SOTA[1]有更高的准确性,并且较传统分子对接方法提速倍以上。相关论文已被收录于ICLR。

蛋白质之间的相互作用是实现其生物活性的重要基础,例如人体可以产生抗体蛋白(上图绿色部分)与入侵的病毒(紫色部分)结合从而抑制疾病。生物制药研究通过分析生物分子之间相互作用的物理、化学机制,进一步设计出可以与一些特定靶点相结合的新型药物分子(如研发新冠抗体)。在微观尺度下,蛋白质之间的相互结合主要由分子间作用力决定,例如氢键、静电力、疏水作用等。

在传统药物研发中,分子对接技术(moleculardocking)通过物理方法建模这些微观作用来模拟计算真实生物体内两个分子相互作用的稳定结构。这些传统的分子对接模型需要进行大量的构型采样及优化,并筛选出其中较为稳定的结构作为预测结果。这种基于采样和筛选的策略导致传统方法效率较低,难以应用于高通量的蛋白质对接任务(例如从1万个蛋白中筛选出最有可能与病毒表面结合的10个来进行湿实验测试)。研发准确且高效的分子对接模型可以帮助快速筛选出适合进行湿实验测试的蛋白质分子,从而提高新药研发的效率。

为了开发更加准确且高效的蛋白质对接模型,字节跳动ByteDanceResearch团队设计了一套基于分子表面的几何深度学习方案。该方案的核心思想是训练AI模型从拼图的角度去理解蛋白质之间的相互作用,并按照拼图的思路实现蛋白质复合物构型预测。

论文

1
查看完整版本: ICLR2023初探AI拼图模型预测蛋白