6月6日,中国科学院上海药物研究所研究员郑明月课题组构建了一种通用蛋白质-配体相互作用评分方法EquiScore,在药物虚拟筛选场景和先导化合物优化场景中,EquiScore对训练未见的新靶标表现出了良好的泛化性能,其可解释性分析为基于结构的药物设计提供了有价值的线索。相关研究发表于《自然—机器智能》。
精准的评估蛋白质-配体相互作用对药物发现至关重要,而开发可靠的评估方法一直是学术界和工业界的长期挑战。近年来,以AlphaFold为代表的深度学习方法在蛋白质三维结构,蛋白质-配体复合物结构预测方面表现卓越,但是在新靶标的药物虚拟筛选场景中,高精度的活性预测评分方法仍然非常匮乏。
研究团队利用等变图神经网络来整合蛋白质-配体相互作用相关的物理先验知识,并且使用多种数据增强、数据去冗余策略来避免模型过拟合潜在的数据分布偏差,并将新构建的数据集和等变异质图网络来训练最终的评分模型EquiScore。
进一步地,研究人员选择了21种不同的评分方法作为基准。经过充分的比较和严格的测试,EquiScore的综合排序能力超过了现有的方法,且对新蛋白的富集能力超过了传统评分方法和深度学习方法。同时,研究团队还在外部的先导化合物优化数据集上比较了EquiScore与其它方法对结构类似物的活性排序能力;使用不同的对接方法生成蛋白-配体复合物结合构象,进一步评价EquiScore作为评分方法的鲁棒性。