16次第一,27次前二,年度评测第一!参赛一周年,智源 OpenComplex 团队在蛋⽩质结构预测权威竞赛 CAMEO① 中取得稳定领先成绩,连续在最近月度、季度、半年度和年度评测周期中排名第一。CAMEO 是蛋白质结构预测领域的权威竞赛,吸引了全球⽣物计算领域顶级实验室和企业角逐,包括 DeepMind、微软、华为、腾讯、百度、北京大学、清华大学、西湖大学等。
OpenComplex 获 CAMEO 竞赛年度排名第一(2023 年 3 月 24 日截图)
在 CAMEO 每周成绩中持续领先②
OpenComplex 是智源健康计算研究中心打造的面向生物大分子的开源人工智能算法平台,目前已开源蛋白质、RNA 以及复合物的高精度结构预测训练和评测代码。此次参加 CAMEO 竞赛的为 OpenComplex 平台的蛋白质结构预测模型。
项目链接:https://github.com/baaihealth/OpenComplex
OpenComplex 平台建立了将「蛋白质结构预测」「RNA 结构预测」和「蛋白质-RNA 复合物结构预测」三类任务统一的端到端生物大分子三维结构预测深度学习框架。上述三类任务的推断和训练可以在该统一的「编码器-解码器」框架中完成,其中编码器支持多重序列比对(MSA)和语言模型(LM)两种编码策略。
在大量数据集(例如,蛋白质数据库 PDB 和 RNA 家族 Rfam 数据库)上的实验结果表明,OpenComplex 能够生成高质量的模型,在蛋白质复合物、RNA 结构预测等任务上与目前全球最优的方法性能相当。
「AI for Life Science 」在智源
智源健康计算中心团队致力于探索人工智能与基础科学深度融合的崭新科研范式,延展不同科学领域的探索边界,造福人类与社会。
在 AI for Science 相关研究中,团队充分利用生成式 AI 和大模型技术,理解生物分子结构和互作方式。与此同时,还在构建自我学习算法,实现模型的自我调优和进化。
交叉研究离不开与不同领域合作伙伴的密切合作,目前团队已和众多顶尖研究机构开展”AI+健康”科研合作,包括清华智能产业研究院(AIR),清华大学计算机系、自动化系,北大计算机学院,人大数学学院以及海德堡大学等。
注:
① CAMEO 是蛋⽩质结构预测领域的权威竞赛,由瑞⼠⽣物信息研究所和巴塞尔⼤学联合举办。按照 CAMEO 竞赛的规则,每位参赛者每周需对约 20 个由权威结构⽣物学家最新破解出的蛋⽩质结构进⾏预测,其得分和排名每周在线更新。
②2022 年 11 月 26 日数据未提交,故成绩记录缺失。