顶科现场|许锦波谈AI未来:从头设计自然界不存在的蛋白质
·虽然在药物研发中,AI开发者长远的目标是可以直接借助AI生成一款药物,并达到基本可用的状态,但对于当下一些期望过高的声音,要抱有正确的认知。AI还没有达到端到端、给定一个靶点马上就能设计出一款药的阶段,药物设计的过程中仍然需要一些跟湿实验技术结合的工作。
“AI蛋白结构预测让我们更好地认识和理解蛋白质,进而理解生命,但仅仅只是认识和理解是远远不够的,我们真正想做的是通过蛋白质来解决疾病、环保等问题,还有按需求来改造蛋白质、甚至从头设计自然界不存在的蛋白质。这也是我们团队正在探索、布局的方向,我们正在将AI蛋白改造和设计技术运用到药物设计、合成生物学等领域,希望为全人类带来福祉。”
11月5日,第五届世界顶尖科学家论坛探究合成细胞分论坛在上海科学会堂举行,清华大学和北京大学访问教授许锦波作了“AI蛋白质设计”的演讲。在会后接受澎湃科技记者采访时,他作了上述说明。
11月5日,许锦波在第五届世界顶尖科学家论坛探究合成细胞分论坛上参与圆桌讨论。
许锦波是清华大学和北京大学访问教授、美国芝加哥丰田计算技术研究所教授,也是AI蛋白质设计平台公司“分子之心”的创始人。他的研究兴趣包括人工智能和机器学习、优化算法和计算生物学。2016年,他提出的RaptorX-Contact方法,首次证明了深度学习可以大幅度提高蛋白质结构预测的性能,拉开AI蛋白质结构预测时代的序幕。他因此被业界称为“AI预测蛋白质结构全球第一人”。
“过去几年,人工智能做了很多很好的工作,尤其是在蛋白质结构预测方面。但是AI在蛋白质预测方面还面临着很多挑战,还有很多问题是AlphaFold2没法解决的。”许锦波在演讲中说。
他举了几个例子,“AlphaFold2很难预测多个蛋白质是如何结合的,特别是在预测抗原、抗体结合方面做得不是很好。AlphaFold2也无法预测某种特性的蛋白,比如孤儿蛋白的结构。尤其是,AlphaFold2无法做蛋白质的设计,也无法优化蛋白质,让蛋白质产生变异,实现希望应用的功能,AlphaFold2也无法预测DNA、RNA等小分子的结构。”他表示,如果要预测蛋白质之间的互动,需要用其他的软件。
从头设计蛋白质
在演讲中,许锦波分享了他在AI蛋白质预测和设计上的最新进展:“我们想要建立一些自然界中没办法存在的蛋白质,尤其是想找到一个或者多个氨基酸序列,根据用户所需要的结构和功能来进行设计。”
为什么要做蛋白质设计?许锦波说,蛋白质设计有很多的应用,比如用于进行疾病的预防、诊断和治疗。他介绍了2021年科学突破奖得主、美国华盛顿大学蛋白设计研究所研究员戴维·贝克(David Baker)的一项工作,“过去几年,他的实验室设计了一个用于诊断新冠患者的病情和研发新冠疫苗的蛋白,目前这个疫苗已在韩国获批治疗新冠患者。”
许锦波还介绍了AI设计蛋白质的方式。和蛋白质结构预测不同,蛋白质设计需要考虑不同的情景,每个情景有不同的问题。有时候研究者想设计蛋白的主干,有时候希望优化氨基酸序列,实现特定的形状,有时候想让设计出来的蛋白质能够与靶向受体进行结合。为此,需要开发不同的算法。
目前,许锦波团队开发的算法已经可以用于设计不同大小和复杂度的蛋白质。他表示,之前用传统的方法只能设计含110个氨基酸的小蛋白,用他的团队开发的方法,可以设计达200-300个氨基酸的蛋白。除了α蛋白,他们也已经可以用AI设计β蛋白。此外,他们还可以用AI来设计更加稳定的蛋白质,这种蛋白质与自然界的蛋白质功能比较类似,但是设计的蛋白质因为更加稳定、没有能量,还能够在极端情况下实现某些功能,比如在高温下实现功能。
用他们开发的方法,模拟自然界中蛋白序列的成功率已经超过50%。该模型还可以用更少的数据来更好地预测蛋白质的稳定性。他们还开发了一个设计治疗蛋白的AI模型,用于改善现有药品的亲和力和特异性,以及从头设计可以与靶向蛋白结合的新蛋白。
正确认识AI在药物研发中的应用
当天论坛结束后,许锦波接受了澎湃科技的采访。他表示,AI蛋白结构预测和AI蛋白质设计都是基于中心法则,底层的思想基础是一致的。AI蛋白结构预测让我们更好地认识和理解蛋白质,进而理解生命,但仅仅认识和理解是远远不够的,我们真正想做的是通过蛋白质来解决疾病、环保等问题,还需要按需求来改造蛋白质、甚至从头设计自然界不存在的蛋白质。这也是他的团队正在探索、布局的方向,他们正在将AI蛋白改造和设计技术运用到药物设计、合成生物学等领域,希望为全人类带来福祉。
AI在辅助药物研发中的作用一直备受关注,许锦波告诉澎湃科技记者,AI可以在药物研发各个环节发挥重要的作用,当下其价值更多的体现在对每个环节的降本增效、提高成功率。聚焦到AI蛋白相关技术在制药环节中,许锦波认为目前AI面临的挑战是,一方面更好地理解蛋白相互作用,从而理解致病机理,找到更合适的靶点;另一方面从更大的空间(比传统方法提高N个数量级)中发现、或者通过蛋白质优化和从头设计的方法,得到更好的蛋白序列、更稳定的蛋白结构,从而优化改造现有蛋白质,减少湿实验(即传统实验)成本,提高效率和成功率。
他也提醒说,虽然在药物研发中,AI开发者长远的目标是可以直接借助AI生成一款药物,并达到基本可用的状态,但对于当下一些期望过高的声音,要抱有正确的认知。AI还没有达到端到端、给定一个靶点马上就能设计出一款药的阶段,药物设计的过程中仍然需要一些跟湿实验技术结合的工作。
许锦波所在的美国芝加哥丰田计算技术研究所是一所受慈善捐助而成立的独立计算机科学研究所,充足的科研时间和较少的经费困扰是他留在那里的重要原因。
2021年,许锦波回国创业,成立了“分子之心”。从静心研究迈向尝试成果转化之路,他向澎湃科技表示,基础研究和成果转化两方面都需要推进。基础研究探索更前瞻的方向,也是源头创新和产业转化的基石;而成果转化能让基础研究的成果走出实验室,通过产业化的方式,为人们所用,发挥真正的价值。成果转化也能让科学家们对真实场景中的需求有更清晰和深刻的认知,反向推动科研。