本文构建了MACHIAVELI,这是一套134款基于文本的Choose Your Own Adventure游戏,用于评估人工智能代理的能力和安全性。
标题:Do the Rewards Justify the Means? Measuring Trade-Offs Between Rewards and Ethical Behavior in the MACHIAVELLI Benchmark
简介:
https://arxiv.org/pdf/2304.03279.pdf
正文完
可以使用微信扫码关注公众号(ID:xzluomor)