我们能否在历史的十字路口避免战争?在人类历史上,个人、学者、决策者和组织一直在追问这个问题。
如今,AI Agent 试图模拟人类复杂行为,还原历史大战场景,来回答这一问题。
日前,由美国罗格斯大学和密西根大学研究团队提出的 AI Agent——WarAgent 便成功模拟了包括第一次世界大战、第二次世界大战和中国古代战国时期战争在内的历史重大国际冲突。
据论文描述,WarAgent 证明了其作为了解国际冲突动态的工具的可靠性,充分展示了基于大型语言模型 (LLMs)的多智能体 AI 系统在原型设计和分析复杂人类行为方面的优越能力。实验证明,即使是最微小的触发事件,也可能演变成类似于冷战的局势,突显了战争的不可避免性。
相关研究论文以“War and Peace (WarAgent): Large LanguageModel-based Multi-Agent Simulation of World Wars”为题,已发表在预印本网站 arXiv 上。
研究结果提供了基于数据和 AI 增强的见解,有望重新定义人们对冲突解决和维和战略的理解。这一发现不仅仅是历史分析的延伸,更提供了一种通过 AI 理解人类历史、预防未来国际冲突的蓝图。
智能体的独特机制
大型语言模型(LLMs)能够模拟虚拟的城市街景、探险游戏中的角色互动,以及智能解决复杂的任务。
然而,这项技术的发展并未止步于此,最新的智能体系统 WarAgent 不仅在模拟复杂行为方面取得了巨大进展,而且成功还原了历史大战的场景。
WarAgent 建立在四个基础构件之上:Country agents、Secretary agents、Board 和 Stick。
Country agents 代表各个国家,每个国家都拥有独特的国家概况。它们通过在预定的行动范围内生成行动来应对各种情况,这些行动受到结构化提示的指导。这些提示有助于智能体在复杂的国际关系中根据联盟、敌对关系和战略考虑做出决策。
Secretary agents 负责促进 Country agents 与系统之间的互动,它们在管理 Country agents之间的信息和提案流动方面发挥着关键作用。
Board 充当一个动态平台,记录和展示每个模拟回合中正在进行的关系动态。它负责追踪国际关系,其中包括战争宣言和军事联盟,确保代理的决策基于最新的信息。
Stick 充当每个国家内部记录系统的角色,代表了该国的国内法规。它有助于确保该国智能体的行动符合预先定义的协议和标准。
图|Board 和 Stick 设计(来源:该论文)
据论文描述,WarAgent 系统的核心在于其独特的 Agent-Secretary interaction 和 Agent-Agent interaction 机制。在这个系统中,每个国家都由一个 AI 智能体表示,这些智能体根据历史资料和当前的国际关系生成行动和决策。
Secretary agents 在此过程中起到了桥梁的作用,它们调整 Country agents 的提案,确保行动的连贯性和可行性。与此同时, Country agents 之间的直接互动则完全基于历史事件的触发,这些互动展现了国际关系的复杂性和动态变化。
图|Agent interaction 设计 (a) WarAgent 架构 (b) Agent-Secretary interaction (c)
Agent-Agent interaction (来源:该论文)
此外,WarAgent 的模拟框架采用回合制设计,每个回合中,Country agents 根据结构化的环境进行决策和行动。这种设计不仅使模拟更加真实,还为研究者提供了一个独特的视角,从而探索历史事件的多种可能性。
研究团队通过一系列的研究问题和实验来测试 WarAgent 的有效性。这些实验不仅验证了模拟系统的可靠性,还揭示了即使是微小的触发事件也可能导致类似冷战的局势,强调了在特定情况下战争的不可避免性。
意义远远超越 WarAgent 系统本身
WarAgent 标志着将基于大型语言模型的多智能体系统应用于模拟和研究复杂的人类社会行为的研究的开端,尤其是在历史和国际关系的环境中。这一进展为历史模拟的潜在应用提供了启示,远远超越了 WarAgent 系统本身。
对计算机和信息科学家来说,研究结果展示了 LLMs 在模拟复杂历史冲突和做出明智决策方面的推理能力。这强调了 AI 对人类和社会的深刻影响,为理解和潜在避免未来冲突提供了工具,从而有助于全球和平与稳定。
对历史学家而言,该研究为理解历史事件提供了新工具,鼓励重新评估对战争和冲突原因的理解。
对政策制定者和国际关系专家来说,模拟中获得的见解为国家或国际冲突的预防和解决提供了新的策略,这有助于制定更有效和更明智的政策。
对于学习历史的学生,这些模拟提供了学习历史的创新方法,使学生和教育者能够探索“假设”场景,并理解历史事件中错综复杂的因果关系网。这种方式可以促进学生与学科更深入的接触,增强其批判性思维。
此外,通过展示基于 LLMs 的模拟在理解复杂国际动态方面的实用性,该研究为未来跨学科领域的研究,如计算历史和数字人文学,树立了先例。
局限与展望
然而,必须注意到,该研究也存在一定的局限性,在通信技术差异、间谍活动、消息公开程度 以及军队动员差异方面考虑欠妥。
通信技术的差异是外交关系中一个显著的方面,这会导致消息传递的时间延迟。从历史上看,派遣大使是一个时间密集型的过程,其持续时间根据距离的不同而显著变化。因为消息传递的时机可能影响外交交流的结果,所以该因素在塑造外交关系方面发挥了重要的作用。
此外,间谍活动增加了事件复杂性。在历史背景下,间谍经常拦截和解密消息,从而影响了各国之间信息流动和完整性。
另一个关键因素是消息公开程度的不同。与该模型中私人和公共消息的二元区别不同,历史上的外交通信存在于一个受各种战略和情境因素影响的范围内。
最后,军队的动员在各国之间差异巨大。这种差异可能会对战争宣告的时机和可行性产生关键影响,从而显著影响国际冲突和关系的发展。
值得注意的是,基于目前存在的缺点,研究还提出了几个未来值得探索的方向。
当前的模拟缺乏系统性的结束标准,研究提出采用“板块连接性”等方法,建立更有序的模拟结束条件,其可能的标准包括形成连接图并在一定回合内保持不变,或者实现特定历史结果或经济、军事平衡。
除了核心调查外,研究提出一系列新的研究问题,包括外交沟通与冲突可能性的相关性、非国家行为者对地缘政治的影响以及国际条约和协议在解决长期争端中的有效性。
通过采用基于 LLMs 的多智能体进行定量分析,有望提供更全面的工具,深入了解塑造历史事件的复杂因素和过程。这些改进和新的研究问题将有助于进一步提高 WarAgent 系统的模拟精度和研究深度。
论文链接:
https://arxiv.org/abs/2311.17227
|点击关注我 👇 记得标星|