Nature重磅:人类的这一能力,被AI掌握甚至超越了

1,663次阅读
没有评论

人类语言和思维的力量源自系统的组合性。如今,人工智能AI)或许也掌握了这种能力。

人们善于学习新概念,并将它们与已有概念进行系统组合。例如,一旦一个孩子学会了如何跳跃,他们可以通过组合技能理解如何向后跳或绕锥形物跳两次。

这种将新老概念结合的能力被称为系统泛化(systematic generalization)。

而此前,Jerry Fodor 和 Zenon Pylyshyn 两位认知科学家曾主张,人工神经网络缺乏这种能力,因此不适合作为人类认知的可靠模型。

然而,一篇发表在 Nature 上的最新研究挑战了这个已经存在了 35 年的观点。

在该研究中,纽约大学心理学和数据科学助理教授 Brenden  Lake 和西班牙加泰罗尼亚研究所(ICREA)教授 Marco Baroni 提出了一个具有类似人类系统泛化能力的神经网络。

Nature重磅:人类的这一能力,被AI掌握甚至超越了

具体而言,研究团队使用了一种“组合性元学习(MLC)”的方法来优化组织能力。通过并行比较人类与神经网络,他们发现,MLC 能掌握、有时甚至能超过类似人类的系统泛化能力。另外,MLC 还在多个系统化泛化基准测试中提高了机器学习系统的组合技能。

该方法可以让机器与人进行更自然的互动,甚至超过目前最好的 AI 系统。虽然基于大型语言模型(LLMs)的系统(如 ChatGPT)在许多情况下都能很好地进行对话,但在其他情况下却表现出明显的缺陷和不一致。


相关论文以“Human-like systematic generalization  through a meta-learning neural network”为题,已发表在权威科学期刊 Nature 上。

研究团队表示,虽然元学习方法无法让该神经网络对训练之外的任务进行泛化,但他们的研究结果有助于今后开发出行为更像人类大脑的 AI。

达到甚至超越人类水平

 

在这项研究中,MLC 方法仅使用了普通的神经网络,并没有添加符号机制,也没有人工设计的内部表示或归纳偏见。

 

为了展示 MLC 的能力,研究人员在相同的系统性泛化测试中将人类和机器进行了并行评估。具体来说,他们使用了伪语言中的指令学习任务来检查人类和机器对结构化代数系统的学习能力,并通过少样本学习的方式来评估人类的系统性泛化能力。

 

Nature重磅:人类的这一能力,被AI掌握甚至超越了

图|MLC 架构(来源:该论文)

为探索人类的归纳偏见以及这些偏见如何促进或妨碍系统性泛化,研究人员通过研究高度模糊的语言来进行评估。在这些评估中,MLC 在实现(甚至超越)人类水平的系统性泛化方面表现出色。

 

此外,在纯粹的代数推理和模拟人类复杂组合行为的情况下,MLC 均表现出了一种与人类相似的错误模式,这显示出神经网络不仅具备出色的建模能力,也在模拟复杂的人类行为方面表现出了卓越的性能。

Nature重磅:人类的这一能力,被AI掌握甚至超越了

另外,研究团队还对两个广泛应用的基准测试进行了尝试,即 SCAN11 和 COGS16,着重关注MLC 在系统性词汇泛化方面的表现,特别是处理新单词和单词组合(而不仅仅是新的句子结构)。结果表明,除了在预测人类行为方面表现出色,MLC 在机器学习的系统性泛化基准测试中仅出现低于 1% 的错误率。

 

该研究展示了 MLC 如何通过其卓越的组合技能,使一个经过优化的标准神经网络能够模仿或甚至超越人类在系统性泛化方面的表现,从而在比较中表现出更强的系统性。相较于经过标准方式训练的神经网络,MLC 表现出更细致入微的行为。此外,MLC 还让神经网络能够处理其他已知挑战,如系统性地使用孤立的基元和运用互斥性来推断含义。

有望解决更广泛的问题

尽管 MLC 取得了一些成功,但它并不能解决所有挑战。例如,MLC 不能自动处理未经练习的泛化形式或在元学习分布之外的概念。此外,它无法泛化到它未经优化的归纳偏见中。

 

在机器学习的语境中,当泛化使新的情节相对于训练情节处于分布中时,元学习策略会成功,即使特定的测试项目相对于情节中的研究示例是超出分布的。然而,仅仅依靠元学习不会使标准网络能够泛化到相对于元学习期间呈现的情节而言又超出分布的情节。当前架构还缺乏发出新符号的机制,尽管可以通过附加的指针机制来引入通过研究示例引入的新符号。

Nature重磅:人类的这一能力,被AI掌握甚至超越了

在机器学习背景下,当新情境相对于训练情境属于相似分布时,元学习策略会成功。然而,仅仅依赖元学习并不能让标准神经网络实现训练情景之外的分布泛化。并且,目前的架构也缺乏一种生成新符号的机制。

 

最后,MLC 在自然语言的全部复杂性和其他模态上没有经过测试。因此,它是否能够在所有方面以及从实际的训练经验中实现类似于人类的系统性,仍有待确定。

Nature重磅:人类的这一能力,被AI掌握甚至超越了

然而,该研究有望帮助 MLC 解决更广泛的问题。举例来说,一个 LLMs 可以进行专门的元学习,通过交替进行标准训练(例如下一个单词的预测)和不断引入新词汇,从而优化其组合技能。

 

最后,作者在文中表示:“尽管将 MLC 应用于每个领域是一个长期的努力,但我们看到了在理解人类组合技能的起源以及使现代 AI 系统的行为更类似于人类方面的真正前景。

 

论文链接:

https://www.nature.com/articles/s41586-023-06668-3

https://www.nature.com/articles/d41586-023-03272-3

作者:闫一米 编辑:学术君
|点击关注我 👇 记得标星|

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 10 月
 1
2345678
9101112131415
16171819202122
23242526272829
3031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议 梦晨 2025-12-11 15:33:51 来源:量子位 A...
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1 十三 2025-12-15 14:13:14 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了 衡宇 2025-12-10 12:3...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案 十三 2025-12-10 1...
九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局 量子位的朋友们 2025-12-10 18:...
乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头 梦瑶 2025-12-10 20:41:15 来源:量子位 梦瑶 发自 ...