
Sci. 2023, 5, 845–860.)【1】。 作者首先将经典的强化学习算法应用于蛋白质序列设计中。EvoPlay接收全长和指定区域的蛋白质序列作为输入,将序列上残基的突变事件定义为一个动作空间,通过神经网络指导的蒙特卡罗树搜索(Monte Carlo tree
search, MCTS)算法在蛋白质序列空间中不断突变、搜索和优化序列,对每个突变状态进行评分,并在序列满足预定要求时停止并输出优势序列。 EvoPlay能够避免其他强化学习模型仅在终态序列进行评分和奖励的弊端,在增强传统MLDE采样效率的同时还能够外接序列功能或结构预测模型(如Alphafold2),实现端到端地输出序列对应的功能性质和三维结构。 作者使用以GP回归评分值为奖励,选取了4个具有代表性的多肽体系用以验证EvoPlay能否高效地生成高质量的结合肽序列。对于其中的核糖核酸酶体系,EvoPlay生成的序列展示出显著的新颖性和多样性(图1),且表现出与RNase1良好的结合构象(图2)。实验测定结果也验证了EvoPlay设计肽与RNase1靶标具有比野生型更强结合亲合力。



Y., Tang, H., Huang, L. et al. Self-play reinforcement learning guides
protein engineering. Nat. Mach. Intell. 2023, 5, 845–860.
正文完
可以使用微信扫码关注公众号(ID:xzluomor)
