微软研究院最新154页长文:广义人工智能的火花,GPT-4的早期实验

898次阅读
没有评论

微软研究院最新154页长文:广义人工智能的火花,GPT-4的早期实验

人工智能AI)研究人员一直在开发和改进大型语言模型(LLM),这些模型在各种领域和任务中展示了令人惊叹的能力,挑战了我们对学习和认知的理解。 OpenAI最新开发的模型GPT-4使用了前所未有的计算和数据规模进行训练。在本文中,我们报告了我们对OpenAI积极开发的GPT-4早期版本的调查。我们认为(这个早期版本的)GPT-4是新一代LLM的一部分(例如包括ChatGPTGoogle的PaLM),比以前的AI模型展现出更普适的智能。我们讨论了这些模型的不断提升的能力和影响。我们证明,除了其对语言的掌握外,GPT-4可以解决跨数学,编码,视觉,医学,法律,心理学等领域的新颖和困难任务,而无需任何特殊提示。此外,在所有这些任务中,GPT-4的表现与人类水平的表现非常接近,并且通常远远超过之前的模型,例如ChatGPT。鉴于GPT-4的能力的广泛和深度,我们认为它可以合理地视为人工通用智能(AGI)系统的早期(尚不完整)版本。在我们对GPT-4的探索中,我们特别强调发现它的限制,并讨论了朝着更深入和全面的AGI版本发展的挑战,包括可能需要追求超越下一个词预测的新范 Paradigm。最后,我们通过对近期技术飞跃的社会影响和未来研究方向的思考来结论。

标题:Sparks of Artificial General Intelligence: Early experiments with GPT-4

论文:https://arxiv.org/pdf/2303.12712.pdf

作者:Sébastien Bubeck(高级首席研究经理), Varun Chandrasekaran, Ronen Eldan, Johannes Gehrke(雷蒙德实验室主任), Eric Horvitz(首席科学家), Ece Kamar, Peter Lee, Yin Tat Lee, Yuanzhi Li, Scott Lundberg(高级研究员), Harsha Nori, Hamid Palangi, Marco Tulio Ribeiro, Yi Zhang

微软研究院最新154页长文:广义人工智能的火花,GPT-4的早期实验

 

 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy