智商超过99.9%人类，ChatGPT到底有多聪明？

图片来源@视觉中国

文 | 追问NextQuestion，作者 | Eka Roivainen，编译 | 梓葳

在过去的两个月，ChatGPT引起了学术界、科技界、传媒界的疯狂讨论。这个号称地表最强的“人工智能聊天机器人”只花了5天时间，用户就突破了100万，成为世界上达到百万用户数最快的应用。

ChatGPT，不仅能跟你对话，还能完成撰写邮件、视频脚本、文案、翻译等一系列基础工作，涉及历史、科技、文化等诸多领域，甚至还能写诗、写论文、编代码、改bug、求医问药等，一部分人不禁开始为人类终将要被人工智能取代而恐慌。那么，如今大火的ChatGPT是否具有与人类相当的智商与心智水平？

Eka Roivainen是一名来自芬兰奥卢大学附属医院的评估心理学家，他的研究方向包括认知和人格心理学以及心理测试的有效性。在了解到ChatGPT所拥有的多种人类技能后，Roivainen不禁好奇：以人类的标准看待，ChatGPT究竟有多聪明？

超越99.9%的人类：ChatGPT表现出超高智商

于是，Roivainen开始着手对ChatGPT进行智商测试。他表示，ChatGPT十分适合作为一个被试，它不仅不会在测试中表现出应试焦虑、注意力不集中或放弃，也不会对智商测试和测试人员产生质疑。

Roivainen采用第三版韦氏成人智力量表（the Wechsler adult intelligence scale, WAIS）对ChatGPT进行了智商测试。该量表包括6个语言子测试集与5个非语言子测试集，智商测试的最终分数基于所有11个子测试集的分数。平均智商设为100分，测试量表的标准偏差为15分，这意味着最聪明的10%和1%的人的智商分别为120和133。在6个语言测试集中，第六个子测试集为数字广度，它对注意力、短时记忆能力进行评估，由于不能使用文字形式展示给ChatGPT因此没有对ChatGPT进行该测试。他从词汇子测试集开始对ChatGPT进行智商测验。由于ChatGPT接受了大量在线文本的训练，Roivainen预计该测试对ChatGPT来说应该是比较容易的（词汇测试集对单词、语言概念的形成进行测试）。

不出所料，ChatGPT表现很好，它给出的答案通常非常详细和全面，甚至超出了测试手册中给出的正确答案的标准。在知识和相似性子测试集中ChatGPT也表现良好，达到了最高分（知识子测试集是对常识的测试，反映了求知欲、教育水平以及学习和记忆事实的能力）。相似性子测试集测试抽象推理和概念形成能力。在这个子测试中，聊天机器人倾向于给出非常详细、复杂的答案。在算术子测试集中，ChatGPT正确回答了所有提供的算术问题，包括取均值等。

综合5个语言子测试集的分数后得出，ChatGPT的语言智商为155，高于构成美国WAIS III标准化样本的2450人中的99.9%。由于ChatGPT缺乏必要的眼睛、耳朵和手，它无法参加WAIS的非语言子测试集的测试。但是在标准化样本中，语言智商和全面智商量表高度相关，所以ChatGPT从任何人类标准来看都非常聪明。在WAIS标准化样本中，受过大学教育的美国人的平均语言智商为113，5%的人得分为132或更高。Roivainen表示自己在大学时测试的言语智商结果没有达到ChatGPT的水平。