近段时间,关于人工智能在药物研发中的失败讨论得很多,虽然这些基本都是事实。
而且到目前为止,“人工智能生成”的药物还没有达到他们在临床上的炒作和期望,但结论并不完全正确。
文章对于人工智能(或者说“机器学习”)对于当下管线的作用存在根本性误解,以及为什么AI制药公司和它们的批评者的某些主张经不起更仔细的思考。
的确,人工智能有局限性
机器学习不是药物发现的灵丹妙药。而且可能永远不会(至少在未来 50-100 年内不会)。
原因是药物发现过程太复杂了,人类生物学太复杂了。
这意味着我们不太可能收集到足够数量的数据来计算设计和预测临床试验的结果,而忽略了当今技术甚至可能无法获得所有相关生物学参数的事实。
这与过去几年提出的一些主张形成鲜明对比。公平地说,这些说法中的一些虽然没有根据,但导致了不切实际的期望。
但这是否意味着机器学习没有任何影响?
目前,机器学习主要用于将新的候选药物带入临床前阶段。这意味着机器学习可以帮助识别新的靶点,找到更好的命中分子,或者优化命中,将它们转化为早期线索,然后是晚期线索,甚至可能成为开发候选者。
这意味着它可以帮助我们找到满足分子靶标图谱或复杂靶标产品图谱的分子(如果我们幸运的话,临床前测试都是阳性的,例如通过PK/PD或早期毒性预测)。
如果我们优化的分子产品或目标产品与以往的分子没有根本区别,那么最终生成的分子也不太可能和以往分子(原研药)有根本的不同。
那么问题来了,为什么化合物会更成功呢?
知道要优化什么通常是最大的问题。有时我们知道我们想要什么,但不知道如何优化它,或者更常见的是,我们根本不知道要优化什么,因为我们对疾病生物学没有很好的了解。
一些支持人工智能的药物发现公司追求新的靶点——可能没有适当的(临床)验证。
如果靶点不是新的,并且有足够的证据与临床相关,那么人工智能就无法帮助我们。即使是最好的化合物也可能在临床上没有预期的效果。
然而,在大多数情况下,这些靶点并不新鲜。看看Exscientia的产品线,特别是他们的5-HT1a激动剂DSP-1181,这是用于治疗精神病的经典靶点。
事实上,在GlobalData上快速搜索显示,有516个分子处于该靶点的不同阶段,结构分析还显示,该化合物与氟哌啶醇具有相同的形状,氟哌啶醇是一种常用的第一代抗精神病药,FDA于1967年批准了氟哌啶醇。
从机器学习的角度来看,这是有道理的,因为有大量的训练数据可用,因此更有可能使用机器学习。
然而,虽然这些数据可以帮助训练机器学习模型,以快速找到命中和潜在的一些优化的线索,但它不一定会增加临床试验成功的整体概率——这意味着药物仍有90-95%的可能性会失败。
为了增加成功的机会,我们需要优化化合物,以满足对疾病的更好理解或从以前的失败中产生的新见解所驱动的要求。没有这一点,我们不能指望任何新药优于以前的药物,除非是偶然的。
当前,根本没有足够的可靠信息来输入机器学习模型,使我们能够预测强迫症、抑郁、焦虑等疾病会发生什么。
这就是问题所在。
由于某些预期或意外的原因,药物在每个阶段都会失败。有些是由于生物学,有些是由于技术问题,有些是由于监管变化,有些可能是流行病学。
有时我们没有选择正确的目标,因为我们对疾病状态的生化理解是错误的或不完整的。但是,由于意想不到的毒性,它们同样会失败,而毒素的情况与中枢神经系统的功效相同:无论我们拥有多么好的机器学习模型,我们只是没有足够的知识来告诉我们是否会遇到这样的问题。
但这是否意味着机器学习毫无用处?
当然不是。虽然选择错误的靶点往往是问题所在,导致临床试验缺乏疗效,但失败的原因有很多。
一项研究显示,临床II期和III期试验的大多数失败是由缺乏有效性(52%)或安全性(24%)引起的,其余的失败还包括战略不当(15%)、商业原因(6%)和操作相关(3%)等原因。
例如,毒性是其他主要原因之一,就像许多T细胞结合器一样。靶向肿瘤效应通常会导致剂量限制性毒性。
通过设计考虑到这些学习的分子,我们可以克服过去的挑战,设计出新颖、更有效、更安全的治疗方法。
一旦我们有了这些新颖的见解,例如对疾病生物学或毒性性质的更好理解),并且我们有了良好的转化模型来对此进行早期测试,那么我们就可以使用机器学习来帮助我们生成和优化这些新疗法。
事实上,我们可以使用机器学习筛选更大的化学或生物空间,这可能有助于我们找到满足当今治疗更复杂要求的候选药物。
也许在10年、20年或30年前,我们无法识别这些候选者。还应该指出的是,很大一部分同类最佳药物不是首先推出的,而是吸取了前几代人的经验教训。
当然,另一方面,新的模式、形式等,或者更广泛地说,任何新的生物学或化学都可能带来新的风险——未知的未知数。在这里,机器学习也无济于事。
谈谈AI能做什么
现在,我们来谈谈如何证明人工智能是有效的?
当前,我们只能评估在每个阶段使用机器学习的好处。这样做的原因是我们可以建立明确的基准来进行比较。要求进行全面的头对头比较是一项不可能完成的任务。
例如,我们想比较人工智能项目与非人工智能项目的临床试验成功率,至少需要 150 次临床试验才能观察到统计学上的显着差异。
假设我们有 5% 的成功几率传统项目和 10% 的机会支持人工智能的项目。
这是在假设这些试验是i.i.d.(独立分布假设)的,并且可以通过具有5%显著性和50%功效的功效分析得出;如果我们将功效提高到 80%,这更常见,那么这个数字将增加到 341 个样本,如果没有 i.i.d. 假设,这个数字会更大。
长话短说,我们需要的临床试验数量是巨大的,这意味着如果我们需要判断临床试验的成功率,这需要更多的数据。
除此之外,低垂的果实已经被摘下了,因此将新的试验与历史试验进行比较也不一定是一个好的指标。
除此之外,甚至很难确定什么是人工智能支持的,什么是不支持的。当下,几乎每家药物发现公司都在使用某种形式的机器学习。
无论预测结合、ADME特性、T细胞活化还是可开发性特征——无论是在生物制剂还是小分子中,机器学习现在都非常常见。不使用任何形式的公司肯定会落后。
现在找到更好的候选药物才是关键。在一个由20-30个项目组成的大型投资组合中节省几个月的时间,仍然可以带来巨大的累积节省和收益。
例如,假设AI能够将从目标到优化潜在客户的时间缩短50%。从成本和时间的角度来看,这可能使我们能够运行更多的项目,然后最终选择表现最好的项目进入临床。
图 :Cowen and Company 2022 年 21 月在药物开发中的专有 AI 调查 关于人工智能在管道中的分阶段使用
那么,人工智能在当今药物发现中的应用将何去何从呢?
说一种药物需要完全由人工智能设计,即所有步骤都需要完全自动化和自主完成,这与要求驾驶完全自主是一样的。
虽然我们今天还没有完全自动驾驶的汽车,但驾驶自动化并不是失败的。如今,大多数人都非常愉快地使用车道辅助、巡航控制或停车传感器,整体驾驶体验变得更好、更安全。
机器学习和药物发现中的不同步骤也是如此。大多数公司在药物发现过程的所有阶段都非常有效地使用机器学习,而那些不使用AI(机器学习)的公司则落后了。
其愿景是,机器学习将使药物开发过程中的各个模块变得更好或更高效。这些机器学习模块需要与传统方法(包括实验和计算方法)协同工作,以便提供最有可能成功的程序。
并将其与杰出的科学家和新颖的见解相结合,将导致临床试验成功的总体概率更高。
将机器学习集成到管线和现有工作流程中是降低成本和时间以及能够在未来找到更好的治疗方法的关键。
没有像生成模型那样简单的灵丹妙药可以吐出有保证的药物。但也许我们的期望需要重塑,因为尽管机器学习不能保证临床成功,但它肯定可以降低与药物失败相关的一些风险。
最后,这说明了一件事——这并不奇怪:药物发现是困难的。它需要强大的团队密切合作,以实现高质量的科学研究。
为最优秀的科学家配备最好的工具是为患者提供更多更好的疗法的唯一途径。
—The End—
推荐阅读