图片来源@视觉中国
文|vb动脉网
7月12日,英伟达宣布向Recursion投资5000万美元,以加速人工智能药物发现领域的突破性基础模型。此举引发了业内的广泛关注,和二级市场相关标的股价的暴涨。
实际上,英伟达布局AI制药的节奏,是稍显迟疑的。早在2018年,英伟达推出专门针对医疗场景的Clara平台。随后,Clara从影像学AI研究工具逐步拓展边界,开始涉足基因组学。Clara平台很快成为新药研发中的高效工具,它可以用于药物设计,通过不同AI生成分子,来完成蛋白质生成、分子生成与对接等任务,甚至可以预测蛋白质和分子的三维相互作用,从而优化药物在体内的作用方式。
到2023年3月,英伟达已经与包括新药研发在内的全球100多家企业就Clara模型合作。但投向Recursion的5000万美元,却是英伟达在全球AI制药领域的第一笔直接投资。这家成立于2013年的老牌AI制药企业,主要运用细胞的纤维图像特征来进行药物筛选,底层逻辑与一众同行相差很大。
Recurison的特点在于,通过干湿实验闭环高通量地并行多个试验。首先,在实验室里通过各种方式使人体细胞生病,拍摄这些生病的细胞。然后,让机器学习程序来学习这些生病细胞与健康细胞的区别。最后,将各种药物作用于患病细胞,通过机器学习程序来判断细胞是否回归健康状态,从而判断药物的作用效果。
在Recurison的AI制药流程中,细胞层面的基础研究是关键一环。这背后,是一种从复杂的生命现象本质出发去寻找靶点、开发药物的逻辑。在传统用药物研发数据训练的AI制药模型稍显疲态的当下,将AI制药的链条再延长,正在成为一种新的思路。
消失的DSP-1181与跑不动的AI新药
2022年夏天刚到,在资本市场聚光灯下狂奔不到2年后,AI制药迎来首度降温。除了大范围趋冷的外部环境外,被寄予厚望的超级明星产品高调进入临床试验阶段,却迅速遭遇滑铁卢,踩下了AI制药发展的一脚急刹车。
2022年7月,由于临床试验I期不符合预期标准,住友制药宣布停止DSP-1181的开发。随即,DSP1181从Exscientia、住友制药的官方网站上双双消失。自此,开发世界上首个由AI设计的药物分子的尝试,以失败告终。
早在2014年,Exscientia的自动生成化合物的技术,和基于知识的人工智能预测模型,令住友制药十分青睐,双方随即达成合作。住友制药成为全球最早与AI公司展开合作的制药公司之一。在此后的多年间,住友制药和Exscientia共同发力,最终选定开发用于治疗精神疾病的单胺G蛋白偶联受体(GPCR)药物。
合作中,住友制药的化学团队合成Exscientia提出的化合物,药理学团队对这些化合物进行评估,两家公司一起共享活性数据,继续改进药物。基于Exscientia的AI算法模型,双方在不到1年的时间里测试合成了多达350种化合物,DSP-1181是项目启动以来合成的第350种化合物。彼时,行业内完成这项工作的平均耗时超过5年。
此外,双方还在在项目过程中合成类似物。住友制药的化学家同步合成了Exscientia提出的化合物中间体,还设计和合成了一些具有假定药理学数据的化合物,并将这些数据输入Exscientia的预测模型。其中包括为优化化合物结构提供重要构效关系的化合物,这进一步加快了药物发现周期,并使公司在短时间内发现DSP-1181。
2020年初,Exscientia高调宣布,其与日本住友制药合作开发的DSP-1181,进入I期临床试验。DSP-1181启动临床试验之初,住友制药非常兴奋,忍不住夸赞Exscientia采用的创新方法将对中枢神经系统药物做出巨大贡献。
对于DSP-1181的失败终局,有研究者指出,根本原因在于药物分子本身不够创新。
美国化学文摘社(CAS)的托德·威尔斯(Todd Wills),曾对DSP-1181进行了详细分析,发现DSP-1181作用的受体,是抗精神病药物非常重要的经典靶点。换言之,DSP-1181的开发,其实并没有偏离最初的靶点。而在对DSP-1181的专利系统研究后,Wills发现,DSP-1181分子与氟哌啶醇非常相似,后者是FDA在1967年批准的典型抗精神病药物。从这个意义上讲,Exscientia很可能在一个长期发现的分子骨架上进行优化。
DSP-1181的失败,给AI制药的高光时刻蒙上了阴影,却也给这个行业带来关键的转折。在那以后,人们谈及AI制药,除了算法、数据之外,也逐步偏重实验室里的开创新研究。
走过了早期技术、数据积累阶段的迷茫,对于如今的AI制药而言,构建一支临床试验管线,并不太不稀奇。据智药局统计,由冰洲石生物、锐格医药、英矽智能、红云生物等国内AI制药企业开发的新药管线,纷纷进入临床试验阶段。6月末,英矽智能更是在全球率先完成了AI药物INS018_055在II期临床试验的首位患者给药。
真正难的是,如何将临床试验推进下去,许多AI药物被卡在I期临床试验。另据智药局统计,在全球80条获批临床的AI药物管线中,只有29条研发管线推进到临床试验Ⅱ期,没有AI药物管线进入了更后期的阶段。
蒙眼狂奔10年后,AI制药开始有点跑不动。除了倒在I期临床试验的DSP-1181外,此前不久,另一家英国AI制药头部企业Benevolent AI也宣布,一款用于治疗特应性皮炎的候选药物在二期临床试验中未能达到次要疗效终点。而大刀阔斧做AI新药的英矽智能,在谈及II期临床试验时,表现得极为慎重。
奋力的单点突破
尽管已经几起几落,对于AI制药,行业内却尚形成没有明确的定义。人们把利用机器学习、深度学习、自然语言处理、知识图谱等人工智能(AI)技术来进行药物化学分子分析、靶点发现、化合物筛选,甚至临床试验研究等新药研发相关工作的尝试,即为AI制药。
在很多场合,AI制药被视为提升新药研发效率的终极解决方案。但脱离了严格制药逻辑的AI技术,是以一种相互割裂的方式,在单点突破新药研发中的核心环节。
具体而言,在上一阶段的探索中,AI制药被用来完成发现新靶点、筛选化合物这两件极繁琐,却极重要的工作。
一方面,人们希望依托AI制药强大的计算、分析能力,来发现充分挖掘难成药靶点的潜能,绕开同质化的红海竞争。数据统计,在人类蛋白质组中,难成药靶点占了75%以上,一半以上的人类疾病,在临床上尚无药可医。而对于被验证有效的靶点,比如PD-1、GLP-1等,则往往短期内涌入数百家药企,争相开发。
至今,AI制药已经被用来替代常规新药研发中的许多环节。比如靶点确认,这是药物开发中的关键步骤,也是最复杂的步骤之一。现阶段,被用于新药研发的大多数靶点是蛋白质。在基于AI的靶点发现中,研究者首先从蛋白质的序列、结构、功能中提取原始特征,随后通过机器学习的方法,构建准确、稳定的蛋白质模型,最后用这一模型进行靶点功能的推断、预测和分类。这已经成为AI靶点研究的重要手段。
除了结构学数据外,从患者的样本中、海量的生物医学资料中提取基因组学、蛋白质组学、代谢组学等多组学数据,借助深度学习来分析非疾病和疾病状态之间的差异,也可用来发现对疾病有影响的蛋白质。
另一方面,AI技术可能简化药物筛选、合成,降低成本。对于筛选出来得化合物,往往还需要进行溶解度、活性/选择性、毒性、代谢、药代动力/药效以及可合成性等维度条件。这将涉及反复多次的实验过程,费时费力,抬高临床前研究成本。而这种高度重复、涉及大量计算的工作,正是计算机程序所擅长。
在这个过程中,AI技术用来实现分子生成,即让机器学习的方法来产生新的小分子。具体而言,AI可以通过对海量的化合物或者药物分子的学习,获得化合物分子结构和成药性方面的规律,进而根据这些规律生成很多自然界从未存在过的化合物作为候选药物分子,有效构建拥有一定规模且高质量的分子库。
此外,AI技术还被用来完成化学反应设计和化合物筛选。目前,AI正在取得进展的化学领域之一是对化学反应和合成路线进行建模和预测。基于AI技术,将分子结构映射为可以由机器学习算法处理的形式,根据已知化合物的结构,形成多条合成路线,并推荐最佳合成路线。反过来,在给定反应物的情况下,深度学习、迁移学习可以预测化学反应结果。AI技术甚至还可用来探索新的化学反应。在化合物筛选中,AI技术被用来对化合物的化学结构与生物活性之间的关系进行建模,预测化合物的作用机制。
可以说,在每一个独立的节点上,AI制药都已经做到很出色。但这种出色,很难延续到计算机软件之外。除了跑不动的临床试验,AI制药在药企内部颇受诟病,已经是公开的现象。在动脉网的访谈中,被AI制药工程师吐槽分子活性低、制作周期长,被药物化学专家嫌弃技术平台操作困难,几乎成了很多AI制药企业躲不开的宿命。
回过头看,AI制药与药企之间形成鸿沟,一个不可忽视的原因在于,前者追求效率,通过压缩开发时间来验证自身价值,而后者则强调品质,要经过反复论证,来选定好的标的,再推进。从某种意义上讲,AI制药走的是直线,奋力向前跑,而新药研发的过程则更像一个闭环,可以推翻、再重来。
而AI制药的切实落地,或许需要停下单点突破的尝试,转而融入新药研发的闭环思路。
回归做药的真规则
“越来越多的药企在搭建自动化的实验室,”一位投资人告诉动脉网,“在药物发现、化学合成等环节引入AI技术,几乎成为创新药企业的标配。”更有从业者表示,如果自动化的智能实验室提升新药研发效率的功能被验证,将引发大药企的新一轮基建高潮。
动脉网整理公开数据发现,过去2年间,AI制药企业纷纷斥资建设自动化实验室,Exscientia、Relay therapeutics、Instro、BenevolentAI、晶泰科技、英矽智能等领先的AI制药企业相继构建了干湿闭环的实验室环境,而辉瑞、阿斯利康、礼来等跨国药企也纷纷为基于AI技术的药物研发自动化实验室买单。
比如,在位于瑞典哥德堡的AstraZeneca iLab,阿斯利康探索构建全自动药物化学实验室,将新药研发的设计、制造、测试、分析(DMTA)闭环与AI新药研发企业Molecular AI的技术平台无缝集成。其中,AI技术主要完成DMTA闭环中的设计、分析环节,利用AI和机器学习,来帮助化学家更快地做出更好的决策,实现化学家与计算机的有效交互,从而加快化学空间的探索和潜在新药分子的设计。
再如,辉瑞则与晶泰科技合作,利用“AI预测+实验验证”方法来加速新药研发,后者在上海建立了自动化实验室。
“药物的开发是一个多维同步优化的过程,”有从业者向动脉网表示,新药研发的数据规模极大,类型、结构也颇为复杂,构建干湿实验室闭环,可以更高效地完成设计、验证的虚幻。
一方面,药企形成了更体系化的数据管理方式。传统的药物研发,即以实验科学为主。在过往的新药研发中,数据的记录、治理和储存方式,都以实验为核心,需要根据实验需求动态调整。换言之,数据只是实验的副产品。而AI作为虚拟科学、计算科学和数据科学范畴内的方法,数据的重要性不言而喻。这就要求,药企在药物研发中,严格规范数据的格式、标准、质量、数量等。
另一方面,AI制药企业的算法模型也得以针对性地优化,而不是简单地调用。AI与制药这一传统行业的核心业务深度融合,强调深刻的行业理解力和更高的技术准确率。除了从大量的存量论文、实验数据中挖掘新知识,还要具备充分发掘提炼实时实验数据的能力,并根据数据反馈,优化模型、迭代算法。
“除了算法模型、数据,AI制药越来越多关注生物学层面的问题。”另一位从业者指出。诚然,单纯依靠实验本身,只能验证成形的假设,而AI制药面对的,却是一个更加复杂的体系,有许多问题仍然未知。近年来,基于表型的药物发现方式开始受到关注,即直接使用生物系统进行新药筛选。
生命科学的问题何其错综复杂!比做一个有专利分子更底层的逻辑是,对生物学机理的理解,可以破解AI制药的最终难题。行业里的新变化,或许代表着AI制药运行模式的某种正转变,从基于药企实验室的数据、临床数据、理想生物学模型做相对割裂的独立开发,向上游回溯,去用数学方法尝试从生物学视角解构疾病机理,以终为始地去找寻药物。
而这个过程,无疑会涉及更庞大的数据分析、计算,这也是英伟达这样具备掌控算力的企业深度参与其中的重要原因。“不能用低维模型解释高维问题,只有建立对极其复杂体系理解的工具,才可以解答生命科学的复杂问题。”图灵·达尔文实验室副主任,哲源科技联合创始人赵宇博士表示。
对于AI制药而言,单点突破的运行模式,已经在某种意义上被证伪,但行业的生长曲线始终向上。
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App