首个强化学习生成模型AbNovo实现多目标、多约束抗体从头设计,发表于ICLR 2025

背景介绍
抗体是免疫系统中的关键蛋白,能与特定靶抗原结合并触发适应性免疫反应,在癌症、自身免疫缺陷及病毒感染等疾病治疗中具有重要地位。目前,全球范围内已批准应用了百余种抗体药物。
近年来,借助深度生成模型,计算抗体设计取得了长足进展,尤其在增强抗体-抗原结合亲和力方面成效显著。
然而,除了高亲和力之外,抗体还需具备多种理想的生物物理特性,例如稳定性、高靶标特异性以及低自聚合性等,才能实现更优的可开发性与临床安全性。
在湿实验中,传统的「后筛选」方法通常先生成一批抗体候选,再根据目标特性进行筛选和淘汰,但这样的策略效率低下,且难以保证设计到的抗体可同时满足所有指定约束。
AbNovo-利用约束偏好优化进行多目标抗体设计
为应对上述挑战,并进一步缩小计算设计与实际应用之间的差距,研究团队提出了 AbNovo 框架,率先将「带有约束的偏好优化」思想融入到多目标和多约束的抗体设计中,为研发多特性兼优的抗体提供了新思路。
图 1:AbNovo的流程图
主要创新点
应用层面:AbNovo 通过强化学习和深度生成模型引入多目标、多约束的抗体设计思路,直接刻画实际药物研发过程中的生物物理约束。
算法层面:首次将「带约束偏好优化」从语言模型推广至基于扩散的生成模型,设计了相应训练算法,并给出了严谨的理论分析。
性能方面:为缓解抗体-抗原训练数据稀缺问题,AbNovo 还训练了大规模结构感知的蛋白质语言模型,从丰富的非抗体结构数据中学到通用规律,进一步降低过拟合风险。
多目标抗体设计的两阶段约束偏好优化框架
如图 1 所示,AbNovo 在训练过程中包含两个主要阶段:
阶段 1 (基础模型): 使用多模态扩散模型来进行抗体序列和结构的联合设计,得到初步的抗体-抗原条件生成模型。具体地,对离散序列使用基于连续时间马尔可夫链 (CTMC) 的扩散模型,对结构使用基于SE(3) 空间的扩散模型。
阶段 2(约束偏好优化): 使用约束偏好优化对阶段一中的基础模型进行微调。为了设计与目标抗原结合且同时满足其他生物物理特性的抗体,训练目标如下:



为全面评估 AbNovo 的设计效果,论文从两大维度考察结果:
1.物理化学性质相关的指标: 物理化学性质相关的指标主要包含 Rosetta 结合能评估所设计抗体与靶抗原的结合亲和力。使用独立抗体语言模型下的概率似然来评估进化合理性。此外,论文考虑满足与自聚合、稳定性和非特异性结合相关的约束的生成抗体的比例(图 3);Case study:设计抗体的可视化和统计分布

结语
如果你有编程基础或数学基础,对人工智能有浓厚的兴趣,如果你想在一个充满挑战和机遇的创新创业环境中展现你的才华,如果你想与业界优秀的mentor共同快速学习和成长,如果你想找片沃土充分激发自己追求极致的能力和无限的潜能,那么请不要犹豫,加入中原AI院,与我们共同在AGI征程上探索吧!
欢迎通过邮箱或boss直聘投递简历。
投递邮箱:aihr_criait@hnas.ac.cn