人工智能(AI)研究人员一直在开发和改进大型语言模型(LLM),这些模型在各种领域和任务中展示了令人惊叹的能力,挑战了我们对学习和认知的理解。 OpenAI最新开发的模型GPT-4使用了前所未有的计算和数据规模进行训练。在本文中,我们报告了我们对OpenAI积极开发的GPT-4早期版本的调查。我们认为(这个早期版本的)GPT-4是新一代LLM的一部分(例如包括ChatGPT和Google的PaLM),比以前的AI模型展现出更普适的智能。我们讨论了这些模型的不断提升的能力和影响。我们证明,除了其对语言的掌握外,GPT-4可以解决跨数学,编码,视觉,医学,法律,心理学等领域的新颖和困难任务,而无需任何特殊提示。此外,在所有这些任务中,GPT-4的表现与人类水平的表现非常接近,并且通常远远超过之前的模型,例如ChatGPT。鉴于GPT-4的能力的广泛和深度,我们认为它可以合理地视为人工通用智能(AGI)系统的早期(尚不完整)版本。在我们对GPT-4的探索中,我们特别强调发现它的限制,并讨论了朝着更深入和全面的AGI版本发展的挑战,包括可能需要追求超越下一个词预测的新范 Paradigm。最后,我们通过对近期技术飞跃的社会影响和未来研究方向的思考来结论。
标题:Sparks of Artificial General Intelligence: Early experiments with GPT-4
论文:https://arxiv.org/pdf/2303.12712.pdf
作者:Sébastien Bubeck(高级首席研究经理), Varun Chandrasekaran, Ronen Eldan, Johannes Gehrke(雷蒙德实验室主任), Eric Horvitz(首席科学家), Ece Kamar, Peter Lee, Yin Tat Lee, Yuanzhi Li, Scott Lundberg(高级研究员), Harsha Nori, Hamid Palangi, Marco Tulio Ribeiro, Yi Zhang