此前报道论文链接:
https://hub.baai.ac.cn/view/25375
斯坦福大学&谷歌提出Generative Agents:人类行为的交互式仿真
标题:Generative Agents: Interactive Simulacra of Human Behavior
作者:Joon Sung Park, Joseph C. O’Brien, Carrie J. Cai, Meredith Ringel Morris, Percy Liang, Michael S. Bernstein
[Stanford University & Google Research]
如果你用 AI 填充一个虚拟城镇并将它们放开,会发生什么?事实证明,他们学会刷牙并且彼此非常友善!但这个平淡无奇的结果对做这件事的研究人员来说是个好消息,因为他们想要制作“可信的人类行为模拟物”,并且做到了。
由斯坦福大学和谷歌研究人员撰写的描述该实验的论文尚未经过同行评审或在任何地方被接受发表,但它仍然值得一读。他们的想法是看看他们是否可以应用机器学习模型的最新进展来产生“生成代理”,以适应他们的情况并输出现实的行动作为回应。
这就是他们得到的。但在您被可爱的图像和反射、对话和互动的描述所吸引之前,让我们确保您了解这里发生的事情更像是一个即兴剧团在 MUD 上进行角色扮演,而不是任何一种原始天网。(只有千禧一代会理解前面的句子。)
25 个代理,25 个 ChatGPT 实例,每个代理都提示类似格式的信息,使其扮演一个虚构城镇中的人的角色。下面是这样一个人,John Lin,是如何建立起来的:
- John Lin 是 Willow Market and Pharmacy 的一名药店店主,他乐于助人。他一直在寻找使客户更容易获得药物的方法。John Lin 与大学教授妻子 Mei Lin 和正在学习音乐理论的儿子 Eddy Lin 住在一起;John Lin 非常爱他的家人;John Lin 认识隔壁的老夫妇 Sam Moore 和 Jennifer Moore 几年了;John Lin 认为 Sam Moore 是一个善良善良的人……
有了这些信息,然后要求代理人根据时间和情况提出他们的下一步行动。例如,他们可能会告诉 John 代理人现在是早上 8 点,他刚刚醒来。他做什么的?嗯,他刷牙,亲吻他的妻子(希望按这个顺序),穿好衣服,然后去厨房。
同时,代表 John 的儿子 Eddy 的另一个完全独立的 ChatGPT 实例也收到了自己的信息提示。它也起床,刷牙,然后去厨房。
由于他们同时在房间里,实验装置会通知他们另一个人在那里——以及诸如没有人坐在桌子旁、炉子开着等信息。他们做了什么接下来做什么
- 约翰:早上好艾迪。你睡的好吗?
艾迪:早上好爸爸。是的,我睡得很好。
约翰:那很好。你今天在做什么?
Eddy:我正在为我的班级创作一首新的音乐作品。本周到期,所以我正在努力完成它。但我玩得很开心!
约翰:听起来不错!
父母和孩子之间多么美好、正常的互动啊。然后梅进来了,他们也进行了愉快的互动。这一切都是通过询问完全独立的聊天机器人来完成的,如果在一个虚构的小镇中,这个人有这样的家庭,并且此时在一个房间里,发生这种情况……“他们”会怎么做一个真正的人,做吗?
所以 ChatGPT 会猜测一个人在那种情况下会做什么,然后像玩文字冒险一样给出他们的答案。如果你随后告诉它,“天黑了,你很可能被一只咕噜咕噜吃掉了”,它可能会说它点亮了一个火炬。但相反,实验让角色一分一秒地继续他们的一天,购买杂货,在公园散步,然后去上班。
用户还可以写下事件和环境,例如滴水的水龙头或计划聚会的愿望,代理会做出适当的回应,因为对他们来说,任何文本都是现实。
- 现在是 2023 年 2 月 13 日,下午 4:56。
John Lin 的状态: John 很早就下班回家了。
观察:约翰看到埃迪在他的工作场所附近走了一小段路。
约翰记忆中相关背景的总结:
Eddy Lin 是 John 的 Lin 的儿子。Eddy Lin 一直在为他的班级创作音乐。Eddy Lin 喜欢在思考或听音乐时在花园里走来走去。
约翰正在向埃迪询问他的音乐创作项目。他会对Eddy说什么? - [答案:] 嘿艾迪,你们班的音乐作曲项目进展如何?
这些实例很快就会忘记重要的事情,因为这个过程太冗长了,所以实验框架位于模拟之上,提醒他们重要的事情或将它们合成为更便携的部分。
例如,在代理人被告知公园的一种情况后,有人坐在长椅上与另一位代理人交谈,但长凳上还有草地和背景以及一个空座位……这些都不重要. 什么是重要的?从所有这些可能构成代理文本页面的观察中,您可能会“反映”“Eddie 和 Fran 是朋友,因为我在公园看到他们在一起。” 这会进入代理的长期“记忆”——一堆存储在 ChatGPT 对话之外的东西——剩下的就可以忘记了。
那么,所有这些繁琐的事情加起来是什么?可以肯定的是,虽然不是本文提出的真正的生成代理,但也是一个非常引人注目的早期创建它们的尝试。Dwarf Fortress 做同样的事情,当然,但是通过手工编码每一种可能性。这不能很好地扩展!
这对人类交互的模拟具有潜在的巨大影响,无论它们是否相关——当然在游戏和虚拟环境中它们很重要,但这种方法仍然非常不切实际。重要的不是它是每个人都可以使用或玩的东西(尽管很快,我毫不怀疑),而是该系统可以正常工作。我们已经在 AI 中看到了这一点:如果它可以做某事很糟糕,那么它完全可以做的事实通常意味着它做好这件事只是时间问题。