Science|使用AlphaMissense准确预测全蛋白质组错义突变效应

1,391次阅读
没有评论

AlphaFold使用蛋白质序列作为输入,可以大规模预测高度准确的蛋白质结构。这为理解蛋白质生物学(例如蛋白质变异致病性)提供了一个有价值的起点。2023年9月19日,来自Google DeepMind的Jun Cheng等人在Science上发表了一篇题为Accurate proteome-wide missense variant effect prediction with AlphaMissense的文章。

Science|使用AlphaMissense准确预测全蛋白质组错义突变效应

作者在AlphaFold2的基础上开发了深度学习模型AlphaMissense。AlphaMissense利用了多方面的进展:(i) 无监督蛋白质语言建模,以序列上下文为条件学习氨基酸分布;(ii) 使用了源自AlphaFold的系统;(iii) 根据人群频率数据对弱标签进行微调,从而避免人为注释的偏差。Science|使用AlphaMissense准确预测全蛋白质组错义突变效应

AlphaMissense预测致病性

AlphaMissense在临床注释、新发疾病变异和实验分析基准中实现了最先进的错义致病性预测。

准确预测错义突变的临床意义

导致人类疾病的许多基因突变都发生在蛋白质编码区。尽管对DNA进行测序和识别这些突变的能力已大幅提高,但解释其影响的能力仍然有限。在观察到的4百多万个错义突变中,只有2%在临床上被归类为致病性或良性。准确预测错义突变有助于提高罕见病的诊断率,促进相关临床治疗方法的开发或应用。

然而,当前的突变效应的多重检测(MAVE)方法虽然可以系统地测量蛋白质突变效应,并准确预测突变的临床结果,但由于MAVE实验所需的成本和劳动力,对突变致病性的蛋白质组的分析范围仍然有限。

机器学习方法可以通过分析生物数据中的模式来预测突变的致病性。

AlphaMissense:微调AlphaFold以预测突变效应

作者对 AlphaFold2进行了改造,开发了 AlphaMissense。

AlphaMissense利用了AlphaFold的两个关键功能高度准确的蛋白质结构模型和从相关序列中学习进化约束的能力。

Science|使用AlphaMissense准确预测全蛋白质组错义突变效应图1 AlphaMissense 概述

AlphaMissense分两个阶段进行训练。在第一阶段,像AlphaFold一样进行训练,通过预测MSA中随机位置掩蔽的氨基酸的身份来执行单链结构预测以及蛋白质语言建模。作者对AlphaFold进行了一些小的架构修改,并增加了蛋白质语言建模的损失权重,同时仍实现了与AlphaFold相当的结构预测性能。

在第二阶段(图1A),对人类蛋白质进行微调,并为MSA第二行中呈现的变异序列定义了额外的变异致病性分类目标(图1A)。对于训练集,作者为在人类和灵长类动物群体中经常观察到的变异分配良性标记,并为人类和灵长类动物群体中不存在的变异分配致病标记(图 1B)。一旦模型开始在验证集上过度拟合,训练模型就会停止。

AlphaMissense和MAVE方法的比较 

为了评估AlphaMissense和MAVE方法之间的一致性,作者根据两个MAVE数据来源对预测进行了基准测试:在ProteinGym中收集的1种蛋白质的5万个变体和由19种最近发表的人类蛋白质组成的额外基准集,这些蛋白质未包含在ProteinGym中。相对于其他方法,AlphaMissense与MAVE数据的一致性最强(ProteinGym上的平均Spearman相关性–20.0;在额外的 MAVE 基准上–514.0)。当仅限制所有方法评分的3种人类蛋白质的氨基酸突变时,AlphaMissense仍然是25种方法中ProteinGym得分最高的方法(平均 Spearman 相关性–13.0)。Science|使用AlphaMissense准确预测全蛋白质组错义突变效应AlphaMissense 与变异效应的多重化验达到了最先进的一致性

发布社区资源

DeepMind为研究界发布了四个资源。第一个是包含71万个错义突变预测的数据集。在71万个错义突变中,32%被归类为可能致病,8%被归类为可能良性。第二个资源是基因水平的AlphaMissense致病性预测,定义为基因中所有可能的错义突变的平均致病性。第三个是扩展数据集,包含19,233种典型人类蛋白质中所有2.16亿个可能的单氨基酸置换。最后,提供了对60,000种替代转录异构体中所有可能的错义突变和氨基酸置换的预测,以供未来研究和评估异构体的特异性影响。AlphaMissense有可能加速我们对突变对蛋白质功能的分子效应的理解,有助于发现致病基因,并提高罕见遗传疾病的诊断率。

参考资料:

Accurate proteome-wide missense variant effect prediction with AlphaMissense. Science. 2023 Sep 22;381(6664):eadg7492. 

doi: 10.1126/science.adg7492.

https://www.science.org/doi/10.1126/science.adj8672

——— End ———

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 11 月
 12345
6789101112
13141516171819
20212223242526
27282930  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议 梦晨 2025-12-11 15:33:51 来源:量子位 A...
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1 十三 2025-12-15 14:13:14 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了 衡宇 2025-12-10 12:3...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案 十三 2025-12-10 1...
九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局 量子位的朋友们 2025-12-10 18:...
乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头 梦瑶 2025-12-10 20:41:15 来源:量子位 梦瑶 发自 ...