揭秘Agent落地困局!93%企业项目卡在POC到生产最后一公里

59次阅读
没有评论

揭秘Agent落地困局!93%企业项目卡在POC到生产最后一公里

围绕“如何让Agent真正跑起来”这一核心命题展开

编辑部 整理自 凹非寺
量子位 | 公众号 QbitAI

Agent的真正价值不在于演示效果多惊艳,而在于能否真正跑在生产环境里。 数据显示,超过93%的企业Agent项目卡在了从POC(概念验证)到生产的最后一公里。

在量子位MEET2026智能未来大会上,亚马逊云科技大中华区产品部总经理陈晓建系统阐述了企业级Agent从开发到生产的完整路径。

这个数字背后,是无数企业在Agent落地过程中踩过的坑:开发门槛高、工程化能力缺失、模型定制困难、安全边界模糊。

揭秘Agent落地困局!93%企业项目卡在POC到生产最后一公里

 

在刚刚结束的AWS re:Invent 2025大会上,亚马逊云科技将聚光灯对准了Agent。不是因为其他技术不重要,而是整个行业都意识到:Agent正在成为AI生产力释放的关键枢纽。

陈晓建的分享,正是围绕“如何让Agent真正跑起来”这一核心命题展开。

MEET2026智能未来大会是由量子位主办的行业峰会,近30位产业代表与会讨论。线下参会观众近1500人,线上直播观众350万+,获得了主流媒体的广泛关注与报道。

核心观点梳理

  • 一个成功的Agent需要三个模块:模型(大脑)、代码(逻辑)、工具(连接物理世界的手脚)。三者的有效连接是最大的工程挑战。
  • 十几行代码实现过去数千行才能完成的功能,这就是模型驱动开发带来的效率跃迁。
  • 93%的Agent项目卡在POC到生产的跨越上,核心原因是数据质量落差和工程化能力缺失。
  • 模型定制的最佳时机是在基础模型训练阶段,就像人类学习语言,年幼时效果远好于成年后。
  • 对Agent既不能严防死守,也不能过度放任,正确做法是通过策略框架划定行为边界。
    ……

以下为陈晓建演讲全文:

Agent成功的三要素:模型、代码与工具

Agent正在从各个维度释放AI的生产力潜能,它可以替代许多人类以往的工作,甚至能够完成人类此前无法企及的任务。然而从创意到落地,中间需要跨越的鸿沟远比想象中更宽。

我们认为,一个成功的Agent需要三个至关重要的模块。

第一是底层模型。

模型是Agent的大脑,负责产生智慧、提供决策,承担推理、规划与执行的核心职能。

第二是代码。

任何Agent都需要服务于特定场景,提供该场景所需的功能逻辑。这些逻辑需要像构建传统软件一样,通过代码来实现。这一点与大多数已有软件并无本质区别。

第三是工具。

如果把模型比作大脑,那么工具就是连接大脑与物理世界的手和脚。在整个架构中,工具层包括连接不同信息源的各类协议,以及执行各种行为的代码——比如知识库、数据库、代码库,或者浏览器等外部能力。

当然,我们看到很多客户在尝试用自己的方式构建Agent。但如何有效连接这三个模块,带来了巨大的复杂性与挑战。如何高效调用模型能力?如何组织代码逻辑?如何打通与物理世界的连接?不同工具之间的编排,更是给开发者带来了前所未有的新课题。

十几行代码完成过去数千行的工作

基于这些挑战,我们从2024年开始规划:如何构建一套工具,降低开发者构建Agent的门槛?如何让工具编排更加自动化?如何让大模型调用更加便捷?

今年,我们正式推出了Strands Agents

Strands Agents采用模型驱动的方法论,让大语言模型能够自主处理各种场景,从而大幅简化开发Agent所需的代码量。我们经常收到客户反馈:过去需要数千行代码才能开发的场景,现在只需要短短十几行就能实现

在推出Strands Agents时,我们就将其定位为一个开源项目。用户不仅可以直接使用,还可以获取完整源码。更重要的是,Strands Agents采用开放架构,不仅适配亚马逊云科技自身的产品,也兼容业界各种流行的开源或商用框架。

在上周的re:Invent大会上,我们同步发布了两项重要更新。

一是支持TypeScript语言。TypeScript是业界广泛使用的编程语言,通过支持这一语言,可以帮助更多开发者构建更适用的Agent方案。

二是支持边缘设备部署。边缘设备正日益成为人类生活与工作不可分割的一部分,Strands Agents可以为汽车游戏机器人等各类终端提供Agent能力,让Agent不仅能在云端运行,也能在前端智能设备上运行。

93%的项目卡在POC到生产的跨越上

除了开发工具,我们还看到大量客户在Agent的部署与上线阶段遭遇困难。

有一组来自第三方调研的数据值得关注:93%的客户在从POC阶段迈向生产阶段时遇到了重大障碍。换言之,可能只有不到10%的客户能够真正将Agent从POC推进到最终生产环境。

原因是什么?

POC与生产环境之间存在本质差异。在POC阶段,我们可能只需要关注代码效果如何。但到了生产阶段,很多客户发现,原先在POC阶段表现优异的效果突然变得不尽如人意。

一个重要原因是数据。 在POC阶段,数据可以经过精心挑选,保证高质量。但在真实生产环境中,数据是无法被人为筛选和优化的。数据质量的落差,往往是POC与生产效果差异的核心原因。

另一个主要原因是工程化挑战。 一旦业务从POC走向生产,就必须直面一系列生产环境特有的问题:安全、扩容、成本、高可用……这些问题在POC阶段完全不需要考虑,但上了生产就必须正视。

正是基于这些考量,我们意识到:不仅要提供降低编程门槛的开发工具,还需要提供工程化能力,帮助客户跨越从POC到生产的鸿沟。

这就是我们在2025年7月推出Amazon Bedrock AgentCore的原因。

AgentCore是一个完整的工具箱,提供多种能力帮助客户实现底层基础架构的编排。当您的Agent部署上云时,无需关心底层的计算资源、网络资源、安全配置、可观测性如何实现——AgentCore会帮您完成这些底层资源的动态管理。这将极大地帮助客户解决从POC到生产过程中遇到的工程化难题。

模型定制:在“年幼时”学习效果最好

当Agent进入生产环境后,还会面临一系列效率问题:延迟、可扩展性、敏捷性……这些都是实际生产中必须关注的特性。如果延迟从几百毫秒飙升到秒级以上,用户体验会受到极大影响;如果可扩展性不足,业务高峰期同样会出现瓶颈。

这里要谈谈模型定制的挑战。

在很多场景下,通用大模型在标准场合表现出色,但在特定垂直场景中可能无法满足需求。因此,许多客户尝试基于自有数据对开源模型进行定制。但模型定制本身也面临诸多挑战——需要专业技能,需要高质量数据,才能获得理想效果。

在这方面,我们的Amazon SageMaker AI产品提供了丰富的模型定制支持。在本次re:Invent大会上,我们发布了四种不同的模型定制能力,包括强化微调、模型定制化训练、无检查点训练,以及Amazon Nova Forge

这里特别想介绍Nova Forge。Nova Forge允许用户在基础模型训练阶段就注入自己的数据。

打个比方:一个人学习语言,什么时候效果最好?在年幼时期,大脑还在发育阶段,学习能力最强,几乎不知不觉就能掌握一门语言。但如果到了大学阶段再去学一门新语言,可能需要付出极大努力,效果却不如幼年时期。

大语言模型的定制逻辑与此类似。如果能在模型开发阶段就进行定制,效果远优于模型完成后再做调整

划定边界:让Agent既自主又可控

当我们把Agent交付给用户使用时,如果缺乏适当的约束,可能会产生意想不到的后果。这是我们必须规避的风险。

目前业界常见两种极端做法:一种是对Agent严防死守,另一种是过度依赖人工干预。显然,这两种方式都不是理想选择。

针对这一问题,我们在本次re:Invent大会上为AgentCore发布了一项新特性——Policy(策略)。

通过Policy,可以为Agent定义一个行为框架。在这个框架内,Agent可以自主完成任务;但Policy能够明确界定Agent不可逾越的边界。比如,合规性限制、安全红线等都可以通过Policy来配置。我们已经有客户在实际使用这一工具,通过Policy实现安全可靠的Agent运行。

再谈谈自动化。

过去,人类实现工作流自动化主要依赖RPA(机器人流程自动化,Robotic Process Automation)技术。但大模型的出现带来了新的可能性:大模型能够处理更复杂、更灵活的任务,但如何让它与现有工作流深度结合?

为此,我们开发了Amazon Nova Act

Nova Act深度集成了大模型能力与AgentCore的工程化能力,打造了全新的工作流自动化方案。与传统RPA工具不同,Nova Act因为融合了大模型的智能,整体成功率可以达到80%以上。通过Nova Act,大模型可以直接与执行器、浏览器进行交互,实现端到端的工作流自动化。

最后介绍两个案例。

Blue Origin(蓝色起源) 是美国一家商业航天公司,专注于火箭与太空探索。他们已经通过Bedrock和Strands Agents等服务构建了超过2700个内部Agent,实现了75%的交付效率提升,设计质量相比原始方案提高了40%。

Sony(索尼) 是全球领先的电子与娱乐公司。Sony通过构建Agent能力打造了内部的“Data Ocean”数据平台。他们基于Bedrock构建企业级大模型,每天服务超过57000名内部用户,处理多达15万次推理请求。同时,Sony还使用微调能力对Amazon Nova 2.0 Lite进行了定制,将合规审核效率提升了整整100倍。

re:Invent 2025发布了大量新产品,由于时间有限,今天只能介绍其中一部分。通过这些产品,我们希望能够帮助更多企业获得更强的工程化能力,在Agent应用中取得更高的效率。

也希望大家在构建和应用Agent时,可以尝试今天提到的这些能力。

让我们一起构建未来。

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 12 月
1234567
891011121314
15161718192021
22232425262728
293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
共推空天领域智能化升级!趋境科技与金航数码强强联手

共推空天领域智能化升级!趋境科技与金航数码强强联手

共推空天领域智能化升级!趋境科技与金航数码强强联手 十三 2025-12-09 18:18:41 来源:量子位...
起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机” 西风 202...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东

小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东

小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东 Jay 2025-12-09 08:26:01 来源...
梁文锋,Nature全球年度十大科学人物!

梁文锋,Nature全球年度十大科学人物!

梁文锋,Nature全球年度十大科学人物! 一水 2025-12-09 09:46:23 来源:量子位 来自安...
起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机” 西风 202...
摩尔线程新一代GPU架构10天后发布

摩尔线程新一代GPU架构10天后发布

摩尔线程新一代GPU架构10天后发布 思邈 2025-12-09 15:46:09 来源:量子位 国内首个聚焦...
极客公园创新大会 2026在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」

极客公园创新大会 2026在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」

极客公园创新大会 2026在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」 henry 2...