承认吧,我们已经无法忽视生命科学大模型了

612次阅读
没有评论

承认吧,我们已经无法忽视生命科学大模型了承认吧,我们已经无法忽视生命科学大模型了
10月10日,赛诺菲宣布部署百图生科的大模型,显然为大模型在医药研发领域的实际落地树立了标杆性的合作。
据不完全统计,医疗领域从医学科研、药物研发、智慧诊疗、医疗设备运维、医院管理等,国产大模型产品数量不少于40个。
智药局从医疗健康、药物研发、科学研究三个层面,梳理了当前大模型的进展。
承认吧,我们已经无法忽视生命科学大模型了内卷的医疗大模型
当前,医学领域的大模型已经卷起来了。国内今年来发布的医疗健康类大模型已接近20个。
国内外多家公司掀起了医疗大模型的“军备赛”,同时发布方可谓五花八门:互联网公司、AI科技公司、互联网医疗、医疗设备公司、学术机构等。
阿里巴巴、百度、腾讯、京东都发布了自己的医疗大模型,商汤科技、科大讯飞等AI公司也来分一杯羹,以及原本众多的医疗健康公司,一瞬间点燃了该领域的热情。
承认吧,我们已经无法忽视生命科学大模型了
除少数差异化场景外,这些大模型的使用场景基本集中在智能问诊、智能诊断、临床辅助决策、医学影像、医学报告生成等领域,总体而来差别并不大。


这些医疗模型大多以通用大模型为基座,以“通用大模型+微调”的方式,同加入大量医学专业数据,例如中英文的医学文献、百科全书、药典、医学病例等。
许多模型宣布已经媲美人类医生,此前谷歌的医疗问诊AI Med-PalM的研究团队在《自然》杂志发布了研究成果,经临床医生评估,Med-PalM的长篇回答中有92.6%与科学共识一致。
根据MarketsandMarkets的预测,到2025年,全球医疗大模型市场规模将达到38亿美元,而到2030年,这一数字将超过100亿美元
但真实世界的医疗场景下,大模型如何发力?
要知道真实的医疗场景不是知识问答,而是根据患者实际情况解决问题,AI长时间内无法代替人类医生。
更重要的考验是,医疗大模型几乎不被允许出错,并且出错后人类无法对大模型追责。
未来或许大模型最直观的帮助是减轻医生文书上的压力,辅助医生进行临床诊断与决策,帮助患者进行健康管理。

承认吧,我们已经无法忽视生命科学大模型了药物研发大模型
10月10日,赛诺菲宣布部署百图生科的大模型,为大模型在医药研发领域的落地树立了标杆性的合作。

当前有关于医药研发端的大模型并不多,原因在于这个过程不仅需要对生物医药数据有好的清洗思路,此外还需要将自然语言与人类语言进行对齐。
承认吧,我们已经无法忽视生命科学大模型了
百图生科推出的xTrimo生命科学领域的超大规模多模态模型体系,该模型涵盖了生命科学里不同尺度的信息,包括从RNA、DNA、氨基酸序列以及单细胞基因互相之间的作用建模,各个方面实现生命科学大模型的建设。
目前xTrimo能实现包括蛋白质结构预测、抗体抗原复合物的结构预测、亲和力预测,单细胞在扰动下面的响应预测等下游任务。

今年9月,来自清华大学的水木分子发布了生物医药对话大模型ChatDD,作为生物医药研发助手Copilot 可以服务医药研发全流程场景,从立项调研,早期药物发现,临床前研究到临床试验、药物重定位等各环节。

当然,业内对于大模型有不同的看法,由于缺乏高质量的数据以及对生物非常多机制不清楚的情况下,小领域的小数据反而能够提升模型的准确性和落地。
承认吧,我们已经无法忽视生命科学大模型了科研大模型
还有一个无法忽视的则是AI for Science,大模型已经开始在科研领域崭露头角,帮助科学家们获得更深度的洞察。

传统上,生物学一直是假设驱动的:研究人员识别模式,制定假设,设计实验或研究来测试这些假设,并根据结果调整他们的理论。

这种方法正逐渐被数据驱动的建模方法所取代。在这种新兴范式中,研究人员从无假设的大规模数据生成开始,然后训练模型或将数据合并到现有的模型中。

承认吧,我们已经无法忽视生命科学大模型了


目前最显著的是分子生物学,由于测序成本的降低,有关量化基因表达、染色质结构、组蛋白修饰、转录因子结合的测定等结果正在增长,帮助我们获得基因与疾病的关联。
例如scGPT是专为单细胞转录组学、染色质可及性和蛋白质丰度而设计的基础模型。该模型使用来自 1000 万个人类细胞的单细胞数据进行训练,每个细胞包含大约 20,000 个人类基因中一小部分的表达值。
经过训练后,scGPT 可以针对众多下游任务进行微调:批量校正、细胞注释、扰动预测、多组学、生物途径的预测等。
有观点认为,破译生物分子密码与基因组的关系,并不需要用到通用人工智能。将两者相联系,大语言模型已经足以满足这一愿望。
因为,人们并不要求它生成新内容,相反要求它学习现有生物系统的复杂统计特性。并不要求它解决数学问题或发展深层的反事实推理,并且确实期望它能够学习一步因果关系:如果发生某种突变,特定的基因就会发生改变。
从医疗健康—药物研发—科研,可以看到的是,大模型对于解决的问题在不断被细化,但却面临着更多困难和挑战。
首先是对于高质量数据的缺乏,以及数据可用性,包括输出结果的验证,都需要被攻克。
在未来 5-10 年里,生物医学诊断、药物发现、跨健康领域的公司和倡议将把这些模型应用于人类健康和医学领域,产生巨大影响。
我们还可能见证开放基础模型的发展,这些模型集成了从基因组一直到医疗信息的数据。这些模型将极大地加速研究和创新,并促进精准医疗。
—The End—
推荐阅读

承认吧,我们已经无法忽视生命科学大模型了承认吧,我们已经无法忽视生命科学大模型了承认吧,我们已经无法忽视生命科学大模型了承认吧,我们已经无法忽视生命科学大模型了

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy