美国东北大学 & MIT | Reflexion: 一个具有动态内存和自我反思能力的自主智能体

682次阅读
没有评论

【推荐理由】Reflexion 是一种方法,赋予智能体动态内存和自我反思能力,以增强其现有推理跟踪和任务特定行动选择能力。为了实现全自动化,本文引入了一种简单而有效的启发式方法,使智能体能够定位幻觉实例。

Noah Shinn, Beck Labash, Ashwin Gopinath

[Northeastern University & Massachusetts Institute of Technology]

【论文链接】https://arxiv.org/pdf/2303.11366.pdf

【摘要】最近决策型大型语言模型(LLM)智能体在各种基准测试中表现出了令人印象深刻的性能。然而,这些最先进的方法通常需要内部模型微调、外部模型微调或针对定义的状态空间进行策略优化。由于高质量的训练数据稀缺或状态空间缺乏明确定义,实现这些方法可能会带来挑战。此外,这些智能体不具备人类决策过程中固有的某些品质,特别是从错误中学习的能力。自我反思使人类能够通过试错过程高效地解决新问题。在最近的研究基础上,本文提出了 Reflexion,一种赋予智能体动态内存和自我反思能力以增强其现有推理跟踪和任务特定行动选择能力的方法。为了实现全自动化,作者引入了一种简单而有效的启发式方法,使智能体能够定位幻觉实例,避免在行动序列中重复,并在某些环境中构建给定环境的内部记忆映射。为了评估该方法,作者评估了智能体在 AlfWorld 环境中完成决策任务以及在 HotPotQA 环境中完成知识密集型、基于搜索的问答任务的能力。作者观察到分别为 97% 和 51% 的成功率,并提供了关于自我反思的新兴属性的讨论。

美国东北大学 & MIT | Reflexion: 一个具有动态内存和自我反思能力的自主智能体

美国东北大学 & MIT | Reflexion: 一个具有动态内存和自我反思能力的自主智能体

美国东北大学 & MIT | Reflexion: 一个具有动态内存和自我反思能力的自主智能体

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy