忘掉 ChatBots, 智能体 (AI Agents) 将是未来

652次阅读
没有评论

忘掉 ChatBots, 智能体 (AI Agents) 将是未来

编者按:初创公司和科技巨头正试图从仅通过文本提供帮助的聊天机器人转向可以完成任务的AI Agents。最近的演示包括名为Devin的AI编码器和玩视频游戏的Agents。美国WIRED杂志资深作家Will Knight 在 WIRED 发布 《Forget Chatbots. AI Agents Are the Future》“忘掉聊天机器人,AI Agents将是未来”,文章介绍了最新的AI Agents技术发展趋势,着重介绍了一些突出的实例和公司。从Cognition AI发布的Devin,到Google DeepMind开发的SIMA Agents,以及谷歌DeepMind首席执行官Demis Hassabis的展望,这些都显示了AI Agents技术的巨大潜力。

忘掉 ChatBots, 智能体 (AI Agents) 将是未来

随着AI Agents技术的不断发展和成熟,我们可以期待在未来看到更多令人兴奋的创新和应用。这些技术有望成为推动人类进步和提高生活质量的重要工具。

本周,一家名为Cognition AI的初创公司引起了轰动,他们发布了一个演示,展示了一个名为Devin的人工智能程序执行通常由高薪软件工程师完成的工作。像ChatGPT和Gemini这样的聊天机器人可以生成代码,但Devin更进一步,规划解决问题的方法,编写代码,然后测试和实施。

Devin的创建者将其定位为“AI软件开发人员”。当被要求测试Meta的开源语言模型Llama 2在通过不同公司主机访问时的性能时,Devin生成了一个逐步的项目计划,生成了访问API并运行基准测试所需的代码,并创建了一个总结结果的网站。

评估经过策划的演示总是很困难,但Cognition展示了Devin处理各种令人印象深刻的任务。它在推特上让投资者和工程师们赞叹不已,获得了许多认可,甚至激发了一些预测Devin将很快导致技术行业裁员浪潮的到来。

Devin只是我一直在追踪的趋势的最新、最精致的例子——即出现了能够采取行动来解决问题,而不仅仅是提供人类所提出问题的答案或建议的AI
Agents。几个月前,我试驾了Auto-GPT,这是一个开源程序,试图通过在用户的计算机和网络上采取行动来完成有用的任务。最近,我测试了另一个名为vimGPT的程序,以了解新的AI模型的视觉技能如何帮助这些Agents更高效地浏览网络。

我对这些Agents的实验结果印象深刻。然而,就像为它们提供动力的语言模型一样,它们现在还存在相当多的错误。当一款软件正在采取行动,而不仅仅是生成文本时,一个错误可能意味着彻底失败——并可能带来昂贵或危险的后果。将Agents能够执行的任务范围缩小到特定的软件工程任务集合,似乎是降低错误率的聪明方式,但仍然存在许多潜在的失败方式。

不仅仅是初创公司在构建AI Agents。本周早些时候,我写了一篇关于由Google DeepMind开发的名为SIMA的Agents的文章,该Agents玩的视频游戏包括真正疯狂的标题《Goat Simulator 3》。SIMA通过观察人类玩家学会了如何执行600多项相当复杂的任务,例如砍树或击中小行星。最重要的是,即使在陌生的游戏中,它也能成功地执行许多这些动作。Google DeepMind称之为“通才”。

我怀疑Google希望这些Agents最终能够在视频游戏之外的领域发挥作用,也许是帮助用户代表他们使用网络或操作软件。但视频游戏为开发和测试Agents提供了一个良好的沙盒环境,因为它们提供了复杂的环境,可以在其中对Agents进行测试和改进。“使它们更加精确是我们正在积极努力的事情,”Google DeepMind的研究科学家Tim Harley告诉我。“我们有各种各样的想法。”

在接下来的几个月里,你可以期待更多关于AI
Agents的新闻。Google DeepMind的CEO
Demis Hassabis最近告诉我,他计划将大型语言模型与公司先前训练AI程序玩视频游戏的工作相结合,以开发更具能力和可靠性的Agents。“这绝对是一个巨大的领域。我们正在大力投资这个方向,我想其他公司也在这样做,”Hassabis说道。“当它们开始变得更像Agents时,这将是这些类型系统能力的一个重大飞跃。”

忘掉 ChatBots, 智能体 (AI Agents) 将是未来

想要了解更多,欢迎入群交流!

权益福利:

1、AI 行业、生态和政策等前沿资讯解析;

2、最新 AI 技术包括大模型的技术前沿、工程实践和应用落地交流(社群邀请人数已达上限,可先加小编微信:15937102830)


忘掉 ChatBots, 智能体 (AI Agents) 将是未来

关于MoPaaS魔泊云

源于硅谷、扎根中国,上海殷泊信息科技有限公司 (MoPaaS) 是中国领先的人工智能(AI)平台和服务提供商,为用户的数字转型、智能升级和融合创新直接赋能。针对中国AI应用和工程市场的需求,MoPaaS 在业界率先推出新一代开放的AI平台为加速客户AI技术创新和应用落地提供高效的算力优化和规模化AI模型开发、部署和运维 (ModelOps) 能力和服务;特别是针对企业应用场景,提供包括大模型迁移适配、提示工程以及部署推理的端到端 LLMOps方案。MoPaaS AI平台已经服务在工业制造、能源交通、互联网、医疗卫生、金融技术、教学科研、政府等行业超过300家国内外满意的客户的AI技术研发、人才培养和应用落地工程需求。MoPaaS致力打造全方位开放的AI技术和应用生态。MoPaaS 被Forrester评为中国企业级云平台市场的卓越表现者 (Strong Performer)。


忘掉 ChatBots, 智能体 (AI Agents) 将是未来

  END  

▼ 往期精选 ▼

1、初创公司如何从零开始训练出优秀的LLMs


2、谷歌 DeepMind CEO Hassabis 畅谈 Gemini、Scalin Law、通用机器人、大模型开源、超级人工智能

3、Sora的狂欢、世界模型和AGI

4、LLMs的基本组成:向量、Tokens和嵌入

▼点击下方“阅读原文”

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy