导读：人类一直试图打造一种可以自主完成预设目标的代理或实体，即智能体 (AI Agents 或 Agents)，以协助人类完成各种各样繁琐的任务。多年来，智能体作为人工智能一个活跃的应用领域吸引人们不断地研究探索。人们越来越意识到智能体和人工智能的发展是密不可分的。最近大模型在人工智能应用领域的重大突破，更是让人们看到智能体新的发展机会；特别是像 ChatGPT和GPT-4这样基于超受欢迎的Transformer架构的大型语言模型 (LLMs) 改变了智能体能力的各种可能性。它们首次为智能体装备了拥有广泛任务能力的“大脑”，从推理、规划和决策到行动都展现出智能体前所未有的能力。基于 LLM的智能体将有可能广泛深刻地影响人们生活工作的方式。因此有必要在新的背景下系统地审视智能体这个领域。

在接下来的“大模型时代的智能体”系列文章中，我们试图分别探讨大模型时代智能体的一些基本问题，比如，什么是智能体 (AI Agents)？为什么是大语言模型 (LLMs)？怎样构建基于 LLM的智能体？… 我们也将从AI工程的角度探讨基于大模型的智能体机会与挑战。本文是该系列文章第三篇，我们将探讨怎样搭建基于LLM 的智能体。

大模型时代的智能体 (III)：构建基于LLM 的智能体

作者：鲁为民，MoPaaS 创始人和CEO

目录：

1. 基于LLM的智能体的架构

2. 观测与感知

3. 记忆与检索

4. 推理和规划

5. 行动和执行

6. 随机思考和讨论

大模型时代的智能体 (III)：构建基于LLM 的智能体

大型语言模型（LLMs）因为其出色的自然语言理解、处理和生成能力，可以很容易地完成回答问题、写文章、生成创意内容、帮助编程等多种任务，也在很多推理、规划和决策任务上表现出色。但LLMs还只是被动的工具，并且它们依赖简单的执行过程，所以无法直接当智能体使用。智能体机制可以弥补这个问题，它具有主动性，特别是在与环境的交互、主动决策和执行各种任务方面。另外智能体通过挖掘LLMs的潜在优势可以进一步增强决策制定，特别是使用人工、环境或模型来提供反馈，使得智能体可以具备更深思熟虑和自适应的问题解决机制，超越了LLMs现有技术的局限。可以说，智能体是真正释放LLMs潜能的关键，它能为LLMs核心提供强大的行动能力；而另一方面LLMs 能提供智能体所需要的强大引擎。可以说LLMs 和智能体可以相互成就。

由于LLMs的能力边界还在快速拓展，基于 LLM的智能体的组件和定义还在演进中，其产品形态仍有待探索。下面从智能体的应用角度来探讨怎样构建基于 LLM的智能体。

01

基于LLM的智能体的构建

智能体根据设定的目标，确定好需要履行特定角色，自主观测感知环境，根据获得的环境状态信息，检索历史记忆以及相关知识，通过推理规划分解任务并确定行动策略，并反馈作用于环境，以达成目标。在这个过程中智能体持续学习，以像人类一样不断进化。基于LLM来构建一个智能体，充分地利用LLMs的各种能力来驱动不同的组成单元（见图1）：

大模型时代的智能体 (III)：构建基于LLM 的智能体

图1. 基于LLM的智能体应用

具体而言，我们的智能体应用整体结构如图1所示，智能体本身包括观测感知模块、记忆检索、推理规划、和行动执行等模块。这些模块的编排可以选择像Langchain 或 LlamaIndex这样的框架来实现。智能体呈现强大能力的关键在于智能体系统形成反馈闭环，使得智能体可以持续地迭代学习，不断地获得新知识和能力。反馈除了来自环境外，还可以来自人类和语言模型。智能体不断积累必要的经验来增强改进自己，以显著提高智能体的规划能力并产生新的行为，这些行为能够越来越适应环境并符合常识，以更加完满地完成任务。

智能体的一个典型的工作流程如下。智能体获得用户指令，分析确定智能体需要扮演的角色，同时对目标进行初步分解；智能体观测感知环境，获得环境状态信息，根据需要从历史记忆和知识储备中检索相关信息，将智能体放入一个动态环境中，使其能够回顾过去的行为并通过推理对任务进行分析并规划未来的动作，确定执行策略。行动执行模块负责将智能体的决策转化为具体对环境的输出，控制影响环境的未来状态，完成用户设置的目标。在这个过程中的不同阶段，基于LLM的智能体通过提示等方式与LLMs交互获得必要的资源和相关结果。

下面我们将逐个讨论基于 LLM的大模型不同功能模块构建的不同选项。

02

观测与感知

智能体观测并感知环境及其动态变化；获取来自不同来源的环境信息，往往包括以多模态的形式呈现的文本、语音或视觉等等，并经过处理作为智能体观测的环境信息。智能体将部分信息记录到记忆中，并从记忆中检索获得历史序列，即其曾经观测到的环境状态和行动的历史记录，有可能还需要结合其内置的知识，作为其规划形成其行动决策的依据。

感知空间

基于LLM的智能体感知、处理和理解相关信息，包括语言文本、视觉或语音等多模态信息：

语言文本输入：LLMs 的语言理解能力可以使得用户可以方便的使用自然语言和智能体交流，也可以作为交流媒介和其它智能体交流，同时可以适应不同的通信背景和任务时所面临的挑战。它可以方便智能体实现个性化和环境目标泛化：

个性化：

通过LLMs可以提高AI智能体的文本感知能力，使其可以更好地理解人类用户，适应不同的任务环境，并提供更加有效和个性化的回应。特别是人类语言文本通常包括很多隐含内容，比如未明确陈述的信仰、愿望和意图。通过LLMs来理解这些隐含的含义对于智能体以增强通信效率和质量至关重要。
泛化：

基于LLM的智能体旨在处理复杂的环境情况和变化，可能还会因此遇到全新的目标和任务。理解未知任务的文本指令至关重要，而指令微调可以帮助它们实现无样本 (zero-shot)指令理解和泛化，减少对特定任务的微调需求。

视觉输入：视觉输入提供了有关环境世界的更丰富信息，包括环境对象属性和空间关系。纯粹的LLMs在文本语言理解等方面表现出色，但它们缺乏视觉感知能力。为了增强该能力，需要将视觉信息和LLMs融合，提供更广泛的背景信息和更精确的环境理解。比如，通过字幕为图像生成文本描述，帮助基于LLM的智能体更好地理解图像；此外将Transformer的使用扩展到视觉领域，利用自注意力机制有效地整合整个图像的信息；另外直接整合视觉和文本信息作为LLM的输入，可以增强基于LLM的智能体的多模态感知和语言表征能力。

其它模态：基于LLM的智能体可以装备更丰富的观测感知模块使其可以感知环境其它的模态表征信息，使其可以具备听觉、触觉或嗅觉，可以感知温湿度和光的信号等更复杂的环境输入。将文本和其它模态信息与LLMs融合，使得智能体具有对环境更广泛更精确的认知和理解。

可观察性

衡量一个智能体是否具备有效的观测感知能力是看它对环境是否是可观察的(Observable), 即智能体是否可以充分地观测感知到与规划决策相关的环境信息，并从获得的历史信息中了解到环境的相关状态。保证智能体对环境的可观测性除了处理并理解多来源多模态的信息外，智能体一方面还需要保证观测的信息质量和丰富度必须能够足够的反映真实环境状态，使得智能体获得足够丰富的环境知识；另一方面环境观测的频率足够高，可以让智能体及时获得环境状态并捕获环境的变化。

03

记忆与检索

记忆检索模块在智能体中扮演着非常重要的角色。它可为智能体内置相关的知识，同时也存储智能体的经验，包括环境状态和行动的历史信息；并检索记忆的知识和经验来规划未来的行动。记忆检索模块可以帮助智能体积累经验，持续学习，不断进化，并以更一致、合理和有效的方式行动。

历史记忆

基于LLM的智能体通过记忆模块可以模拟认知科学研究了解的人类记忆过程原则和机制。人类记忆遵循从感觉记忆（记录知觉输入）、到短期记忆（短暂维持信息）、再到长期记忆（长时间内巩固信息）的进程。这些记忆对于智能体有效的进行推理规划是必要的；根据这个原则，我们可以有效地设计智能体的记忆模块来应对不同的记忆需求。具体而言，LLMs受其Transformer架构的上下文窗口（Context Window) 信息长度限制，适合于短期记忆。通过记忆存储，比如外部存储，智能体可以根据需要快速查询和检索的长期记忆信息。

短期记忆:

短期记忆包含有关智能体当前情境的最近感知信息，可灵活及时的检索出来实现任务规划。实现短期记忆是一种简单的过程，可以增强智能体感知最近或上下文敏感的行为和观察的能力。基于LLM的智能体主要通过上下文学习利用短期记忆信息；短期记忆的时间跨度受限于LLMs的Context 窗口长度。智能体首先根据任务计划，将相关(短期)记忆信息直接写入LLMs的提示中，启发LLMs推理规划能力来完成任务。这些推理的时间跨度往往决定于智能体的短期记忆的时间跨度。
长期记忆:

随着时间的推移，智能体不断积累短期记忆并巩固其重要信息，形成其长期记忆，可提供稳定的知识和经验历史。智能体需要具有长期保存经验和调用无限知识的能力；通过外部存储和快速检索来实现。长期记忆存储了智能体的过去行为和思考，比如从以前轨迹总结出的成功计划。长期记忆可以根据当前事件进行检索。特别是使用外部知识库存储长期记忆，智能体在增加模型推理准确性的同时也可保护用户隐私。结合短期和长期记忆可增强智能体的推理能力和准确度，充分利用历史成功的经验，有效执行复杂任务，及时应对环境变化。因此在应用中往往采用混合记忆结构以增强其整合知识和经验的能力。

知识记忆

智能体根据其应用场景，往往内置一定的知识；主要包括以下几类知识：

语言：

智能体的交流介质主要是语言；语言知识定义语法，它涵盖了语言学、句法学、语义学和语用学等多方面语言规范。只有具备语言知识，智能体才能有效地进行对话交流并理解内容。此外，LLMs可以让智能体获得多种语言的知识，这样还可消除额外的翻译需求。
常识：

常识知识通常是指人类具备的一般世界事实，这些信息可能在智能体交流的上下文中没有明确被提及。如果不具备相应的常识知识，智能体可能会做出错误的决策，比如在大雨天不带伞。LLMs可以让智能体具备基本的常识。
领域：

专业领域知识是指与特定应用领域和场景相关的知识，如数学、化学、医学、编程、法律、金融、行业、人事、销售等。智能体在特定领域内有效解决问题需要具备一定的专业领域知识。领域知识可以通过微调植入LLMs中，通过提示来获取；也可以存储在外部数据库中，通过检索增强生成(RAG)来提示通用LLMs 利用。

记忆存储

基于 LLM的智能体可以通过以自然语言或者Embedding等方式来实现记忆存储。根据不同的应用场景，智能体采用适当的数据结构的记忆方式，可以提高记忆检索的效率，从而促进对环境交互的迅速响应。

自然语言格式：

经验信息，如智能体的行为和观测历史，往往可以直接用原始自然语言来描述和利用。这种格式具有几个优点。首先，经验信息可以以灵活和易理解的方式表达；此外，它保留了丰富的语义信息，可以提供更全面的信息以指导智能体的行为。Voyager 使用自然语言描述来表示 Minecraft 游戏内的技能，这些描述直接存储在记忆中。
嵌入式(Embeddings)：

使用向量嵌入便于存储和提取相关知识，形成语义相关的任务。在嵌入格式中，将相关数据，比如文本，图像，音频等各种智能体得到的环境反馈信息编码为嵌入式向量来存储，可以增强记忆的检索、匹配和重用。另外专业领域知识文本可以分块地进行嵌入处理以向量的形式存储便于被检索和调用。将经验和知识变为容易存储和搜索是通过向量数据库来实现的。将各种信息用向量数据库存储，作为经验和知识的记忆，需要时便于检索。目前常见的一些向量数据库或服务包括Pinecone,Weaviate, Chroma, Milvus, Pgvector, and Qdrant 等。

大模型时代的智能体 (III)：构建基于LLM 的智能体

图 2. 嵌入 (Embedding) 和向量数据库 (Vector Database)

数据库：

在这种格式中，记忆信息存储在数据库中，允许智能体以高效而全面的方式操纵记忆。例如，ChatDB 使用数据库作为符号记忆模块；智能体可以使用 SQL 语句精确地添加、删除和修订记忆信息。
LLMs 作为知识存储：

一般来说稳定的知识作为训练数据可以经过训练或微调以参数的形式被植入到LLMs 中，需要时通过自然语言来方便地检索，特别是各种知识记忆可以内置到大模型中。另外专业领域知识一般经过处理后存储在知识库中，便于需要时检索应用于 RAG。

所以知识和经验可以以自然语言文本、嵌入 (Embeddings) 以及数据库 (Databases) 等多种形式存储在记忆中，每种形式都具有独特的优势。例如，自然语言可以保留全面的语义信息，便于应用于推理，使智能体的行为规划更直接；而使用嵌入向量允许高效检索记忆记录，提高记忆读取的效率。

记忆管理

智能体往往根据需要利用LLMs将存储在记忆中的过去经验总结简化成更广泛和更抽象见解的能力，以便智能体以后更加有效快捷的检索记忆，同时也可以增加存储的利用率和效率。有些记忆内容，比如对话历史，可以通过总结来移动、编辑、删除或整合。另外，在记忆写入到相应的存储过程中，智能体需要确定遇到与现有记忆相似的信息（即记忆重复）怎么办，比如通过去重来减少占用存储资源，同时便于检索；此外，当记忆达到存储极限时智能体需要根据一定的规则删除信息（即记忆溢出），比如根据FIFO原则。当然用户对记忆也可以人工查看和操作以影响智能体对对话内容的感知，确保记忆内容与用户期望密切一致。

记忆检索

从记忆中快速地检索最合适的内容至关重要。这确保了智能体可以访问相关准确的信息以执行特定的操作。智能体记忆检索往往需要考虑不同度量标准：新近性、相关性和重要性；记忆内容检索的优先级分数可以是这些度量标准的加权组合，分数最高的记忆内容会在模型的上下文提示中优先考虑使用。另外检索的方法也可能影响智能体及时获得相关信息的能力；比如向量数据库内置快速最大内积搜索（MIPS）的搜索技术可以优化检索速度和准确性。

04

推理和规划

推理和规划对于智能体处理复杂任务至关重要。它给智能体赋予一种结构化的思考过程，即组织思维、设定目标，并确定实现这些目标的步骤。比如，通过推理规划，智能体将复杂的任务拆分为更易管理的子任务，并为每个子任务的完成制定适当的计划。规化的结果是形成行动策略，即智能体执行行动的方法。这些策略可能是回忆经验、多轮互动、反馈调整和融入外部工具。推理和规划包括下面一些内容：

目标确认

用户通过指令给智能体的执行目标，比如，目标包括完成某个任务、交流分享信息和环境探索等。智能体根据获得的指令来定义自己的角色，确定需要控制的环境以及实现的目标；当然，这些元素可以是是由用户指令明确给定；但如果不明确，基于LLM的智能体可以根据相关信息来推断并定义，比如智能体可以检索领域相关场景知识和历史记忆，结合指令提示LLMs来更好地定义智能体在该任务扮演的角色以及对环境控制的明确目标。当然可能需要用户确认后智能体才开始执行。

另外，为了更好地用户体验，基于LLM的智能体的应用落地还可能需要生成式AI的 UI 创新带来人机交互方式的革新。

任务分解

智能体在规划中可以利用LLMs将大型复杂任务分解为较小的、可管理的子任务，制定逐步执行的计划。通过精心设计的提示方法，基于 LLM 的智能体可方便地进行任务分解，比如使用思维链(CoT)方法通过分步推理可以自适应地处理整个复杂任务；这些步骤被提供作为示例，提示启发LLMs按照序规划和行动。另外，“一步一步思考(think step by step)“的零样本CoT (Zero-shot-CoT) 允许智能体触发提示时高效创建任务推理过程。重新提示（Re-Prompting）涉及检查每个步骤是否满足必要的前提条件，然后再生成计划。思维树(ToT)等基于树的方法强调计划从树状结构的推理步骤中生成的策略，使得智能体可以最终制定计划之前评估所有可能的路径，获得优化的任务分解规划。

规划反思

在制定计划之后，对其审视和评估至关重要。在很多应用场景中，智能体往往需要通过试错迭代不断地反思来解决复杂任务。智能体对过去的行为进行自我批评和反省，从中吸取经验教训，并为接下来的行动进行分析、总结和提炼，这种反思和细化可以帮助智能体提高自身的智能和适应性，从而提高最终结果的质量。另外，先前的计划的执行可能会受到不可预测的动态变化的干扰，使初始计划无法执行；在这种情况下往往需要根据反馈进行迭代制定和修订计划。基于LLM的智能体利用内部反馈机制，从现有模型中汲取经验获得反馈，以完善和改进其规划方法和执行策略。另外为了更好地与人的价值观和偏好保持一致，智能体往往需要与人互动，以纠正一些误解，并将这些量身定制的反馈融入他们的规划方法中。此外，他们还可以从环境中获得反馈，比如来自任务完成或行动后的观察，帮助他们修订和完善计划。这些与环境互动获得的反馈信息、与人类用户的对话中收集的反馈信息以及从模型或其他数据源中提取的反馈信息可以为智能智能体提供关于任务执行效果的有用信息，从而帮助智能体改进计划和行动。比如Voyager通过整合三种类型的环境反馈来制定计划，包括程序执行的中间进展、执行错误和自我验证结果。

大模型时代的智能体 (III)：构建基于LLM 的智能体

图3. Reflexion 的自我反思

规划工具

基于LLM的智能体可以使用外部工具扩展其能力。为弥补LLMs在推理和规划的有些局限，比如幻觉行为和专业能力缺乏，往往可以将合适的工具整合到其工作流程中。比如，将智能体与特定领域的规划器集成可以提高规划效率。这样它们可以具有丰富的世界知识和卓越的推理能力，使得在意图理解和其他方面的潜力进一步增强，能够很好地分解和处理用户指定的任务。

05

行动和执行

智能体的执行任务的过程中，推理规划确定行动策略，动作执行模块接收相应的行动序列，并执行与环境互动相关的操作，分步将行动策略强加到环境，实现该任务的目标。在策略执行中，智能体可能通过将任务分解成许多子任务来制定行动计划。然后智能体按照这些计划采取行动，如果没有提示计划失败的信号，依次解决每个子任务，以达成最终目标。基于 LLM的智能体的行动空间的组成有多种行动选项：

语言文本

智能体可以通过LLMs 语言生成能力输出作为行动执行指令来驱动影响环境。行动的执行不需要借助外部工具，只需要利用LLMs 通过文本输出作为该智能体行动的执行；这些输出结果包括推理规划能力、对话交流能力、获取知识能力、场景理解能力，这些能力进而驱动智能体本身的行动执行器或其它外部环境的智能体相关的行动。

工具使用

智能体通过引入工具扩展行动执行能力，使其更有能力应对专业或复杂的任务。这些工具包括APIs、知识库、视觉模型、语言模型、知识图谱、Web 信息等。智能体通过引入外部工具，可以弥补LLM的智能体存在固有限制，包括潜在的知识扭曲以及在垂直领域中的有限的专业知识。引入专业工具可为其增强专业性和适应性，特别是在专业任务中的适用性。此外，使用外部工具的智能体在处理高风险领域，特别是安全、医疗保健和金融领域时，表现出更大的透明性、可信度、鲁棒性和安全性。

基于 LLM的智能体需要学习使用工具，根据需要调用合适的工具，这些工具使用信息通常没有被注入到预训练的LLMs，包括当前信息、代码执行能力、对专有信息源的访问等。借助LLMs的零样本和少样本学习能力，智能体可以通过描述功能和使用场景的提示来获取有关工具的知识，包括工具的应用场景和调用方法，类似于人们查阅工具手册或观察他人使用工具的方式。另外，智能体从示范和从反馈学习中学会使用工具。它们根据来自环境和人类的反馈进行调整，包括结果反馈和中间反馈。

工具生成

智能体的工具使用依赖工具的存在。为了消除这种依赖，基于 LLM的智能体本身也可以根据需要创建可以复用的满足特定需求的工具。比如，通过指令或演示，LLM可为某些给定的任务生成Python实用函数作为专属工具来满足其独特的需求；智能体自己可以通过调用其APIs来使用该工具。智能体作为工具制造者，可以根据需要更方便有效地创建工具，使其能够及时与多智能体系统中的其它智能体共享工具。智能体可能在工具使用方面实现高度的自主性。这些工具可以扩展基于LLM的智能体功能。比如，使用它们访问外部资源，提高知识的质量和多样性，并在特定领域提高专业知识；还能为智能体提供了与非文本模态互动的能力，扩展了它们的应用场景，涵盖图像处理、物理建模、机器人技术等领域。

大模型时代的智能体 (III)：构建基于LLM 的智能体

图 4. 利用LLM 生成工具

具身行动

具身（Embodiment)的概念涉及将模型智能与物理世界相结合，使基于LLM的智能体能够主动感知、理解和与环境互动，类似于人类行为。智能体可以利用预训练的内部知识来提升各方面能力；特别是具身智能体利用其语言熟练程度有效地与环境互动并传递技能。LLM智能体可以将其涌现的推理能力无缝应用于复杂任务，遵循高级行动计划，并根据来自环境、模型或人类的外部反馈进行调整。这种动态规划方法减少了在部分可观察环境中对先前知识的依赖，并增强了任务完成能力。具身智能体能够更有效地执行复杂任务，如具体问题回答和自主探索。比如，谷歌DeepMind推出的RT-2是一个视觉–语言–动作模型；它从网络和机器人数据中学习到大量知识，并将这些知识转化为机器人控制的通用指令，并可以直接输出机器人行动动作。它将多模态大模型的能力植入到机械人，这使得机器人也能理解自然语言，能辨认人物，并根据自然语言做出一系列动作；也能泛化到各种新环境、新任务。

06

随机思考和讨论

基于LLM的智能体的潜力让人感到兴奋。我们在本文以及前面的文章中不断提到LLM上下文提示学习模式为智能体在各个环节中解决问题提供便捷性和有效性，以及智能体应用系统的天然反馈闭环为智能体提供持续学习和自我改进的能力；基于LLM的智能体具备了一组全新的能力：解决复杂问题、对外部世界采取行动，并在部署后从经验中持续学习，他们通过推理规划、工具使用以及记忆/递归/迭代//自我反思的组合来实现这些能力。知名的硅谷VC公司 A16Z (Andreessen-Horowitz) 在他们的博文 “Emerging Architectures for LLM Applications” 兴奋地宣称：“智能体有望成为LLM应用程序架构的核心组成部分… 甚至可以接管整个技术栈！”

虽然基于 LLM 的智能体在一些场景呈现难以置信的能力，但当前很多基于LLM的自主智能体的尝试还是会遇到一些问题，比如：

AutoGPT:

曾经火爆的AutoGPT和BabyAGI在实际应用中遇到一些问题。比如除了受到其依赖的大型语言模型的虚构性“幻觉”的困扰外，AutoGPT通常也难以保持在任务上。在成功完成某个任务后，它通常无法记住如何在以后的使用中执行该任务，而当它确实记住时，例如编写程序时，它经常会忘记以后如何使用该程序。AutoGPT在有效分解任务方面遇到困难，并且在理解问题背景以及目标重叠方式方面也有困难。有限的功能集合与GPT-4的受限推理能力相结合，也有可能导致AutoGPT在一些情况下陷入了无休止循环的泥淖，从而无法实现预期的结果。
VOYAGER:

VOYAGER是由英伟达开发的由LLM驱动的具身式终身学习智能体。VOYAGER通过黑盒查询与GPT-4进行交互，避免了对模型参数进行微调。但VOYAGER的任务进行中，不是所有决策链都可以顺利执行。在基于历史经验进行规划和有效探索解决方案空间仍然具有很大的挑战性；尽管可以通过迭代提示机制来实现智能体的规划和技能生成，但仍可能智能体卡住而无法生成正确技能的情况。尽管 LLM 能够尝试调整计划来应对意外错误，但与从反复试验中学习的人类相比，它的鲁棒性较低。

当前大模型技术的飞速发展千变万化，基于大模型的智能体技术和框架也不断涌现，这些都让人目不暇接；试图梳理这样变化的领域是非常有挑战的。但我们将密切关注智能体技术和实践将来的发展。在今后我们还将另文讨论这些问题。

主要参考文献

“大语言模型时代的智能体”系列文章中主要参考了下面文献，更多的有价值的文章可搜索arXiv。

Bornstein, M. and R. Radovanovic, “Emerging Architectures for LLM Applications,” A16Z Blog, 2023.6.20.

Brown, T. et al., “Language Models Are Few-Shot Learners,” NeurIPS 2020, 2020-12.

Bubeck, S. et al., “Sparks of Artificial General Intelligence: Early Experiments with GPT-4,” arXiv:2303.12712, 2023.

Russell, S. J. and P. Norvig, Artificial Intelligence: A Modern Approach (4thEdition), Pearson, 2020.

Shannon, C., “A Mathematical Theory of Communication ,” The Bell System Technical Journal, 1948.

Silver, D. et al, “Mastering the Game of Go with Deep NeuralNetworks and Tree Search,” Nature 529, 2016-01.

Sutton, R. S. and A. G. Barto, Reinforcement Learning: An Introduction (2ndEdition), The MIT Press, 2018.

Turing, A. M., “Computing Machinery and Intelligence,” Mind 49,1950.

Wang, L. et al, “A Survey on Large Language Model Based Autonomous Agents,” arXiv:2308.11432.

Wei, J. et al, “Chain-of-Thought Prompting Elicits Reasoning in Large Language Models,” NeurIPS 2022,2022-12.

Wiener, N., Cybernetics, or Control and Communication in the Animal and the Machine, The MIT Press, 1948.

Wooldridge, M and N. Jennings, “Intelligent Agents: Theory and Practice,” Knowledge Engineering Review, 1995-10.

Xi, Z. et al, “The Rise and Potential of Large Language Model Based Agents: A Survey,” arXiv:2309.07864, 2023.

大模型时代的智能体 (III)：构建基于LLM 的智能体

想要了解更多，欢迎入群交流！

权益福利：

1、AI 行业、生态和政策等前沿资讯解析；

2、最新 AI 技术包括大模型的技术前沿、工程实践和应用落地交流（社群邀请人数已达上限，可先加小编微信：15937102830）

大模型时代的智能体 (III)：构建基于LLM 的智能体

关于MoPaaS魔泊云

源于硅谷、扎根中国，上海殷泊信息科技有限公司 (MoPaaS) 是中国领先的人工智能(AI)平台和服务提供商，为用户的数字转型、智能升级和融合创新直接赋能。针对中国AI应用和工程市场的需求，基于自主的智能云平台专利技术，MoPaaS 在业界率先推出新一代开放的AI平台为加速客户AI技术创新和应用落地提供高效的算力优化和规模化AI模型开发、部署和运维 (ModelOps) 能力和服务；特别是针对企业应用场景，提供包括大模型迁移适配、提示工程以及部署推理的端到端 LLMOps方案。MoPaaS AI平台已经服务在工业制造、能源交通、互联网、医疗卫生、金融技术、教学科研、政府等行业超过300家国内外满意的客户的AI技术研发、人才培养和应用落地工程需求。MoPaaS致力打造全方位开放的AI技术和应用生态。MoPaaS 被Forrester评为中国企业级云平台市场的卓越表现者 (Strong Performer)。

大模型时代的智能体 (III)：构建基于LLM 的智能体

END

▼ 往期精选 ▼

1、大模型时代的智能体 (II)：为什么是LLMs？

2、大模型时代的智能体 (I)：什么是智能体？

3、快捷高效| 通过 MoPaaS AI 平台完成 YOLOv5 训练

4、掀起人工智能新浪潮的OpenAI，看上了ChatGPT之外另一条赛道

ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง

tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.

ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.

ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.

ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!

ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

大模型时代的智能体 (III)：构建基于LLM 的智能体

01

02

感知空间

可观察性

03

历史记忆

知识记忆

记忆存储

记忆管理

记忆检索

04

目标确认

任务分解

规划反思

规划工具

05

语言文本

工具使用

工具生成

具身行动

06

AI青年学霸齐聚杭州！这场峰会要选出「未来科学新星」

李飞飞空间智能独角兽开源底层技术！AI生成3D世界在所有设备流畅运行

终于！全球爆火AI视频神器PixVerse发布国内版——拍我AI

双重突破：全球首个零售VLA大模型来了！开源OpenWBT让机器人遥操门槛暴降！

挑战强化学习后训练霸权！全新无监督方法仅需1条数据+10步优化

通义灵码AI IDE上线，深度适配Qwen3，首创自动记忆功能

GPT-4o-Image仅完成28.9%任务！上海AI实验室等发布图像编辑新基准，360道人类专家严选难题

华为攻克AI推理「想太多」问题！新方法让大模型推理提速60%，准确率还高了

最新一期权威大模型榜单：豆包1.5、商汤日日新V6并列国内第一

每2秒吃透一道高数大题！华为终于揭秘准万亿MoE昇腾训练系统全流程