别再抱怨数据集漂移!捷径学习是梯度和交叉熵导致的

1,494次阅读
没有评论

Don’t blame Dataset Shift! Shortcut Learning due to Gradients and Cross Entropy

A Puli, L Zhang, Y Wald, R Ranganath
[New York University]

别再抱怨数据集漂移!捷径学习是梯度和交叉熵导致的

要点:

  • 研究了为什么默认的经验风险最小化(ERM)——基于梯度的交叉熵损失优化——会产生依赖于不稳定的捷径特征的模型,即使只使用稳定特征可以达到最小的交叉熵损失。

  • 通过对一个线性分类任务的理论分析,指出默认ERM对最大间隔解的隐性归纳偏差会导致它更倾向于依赖捷径特征而不是稳定特征的模型,即使没有过参数化。

  • 分析揭示了在线性任务中,最大间隔分类器通过捷径特征正确地对“捷径”样本进行分类,而通过噪声来拟合剩余的“残差”样本,这导致残差样本的测试精度低于随机猜测。

  • 提出一种称为“边际控制”(MARG-CTRL)的替代方法,其损失函数鼓励样本之间的均匀边际,理论和实证都显示,在MARG-CTRL下,线性模型仅依赖稳定特征。

  • 在视觉和语言任务上的实验表明,MARG-CTRL可以缓解捷径学习,并优于默认的ERM。MARG-CTRL的性能也匹配或超过了更复杂的两阶段方法,如Just Train Twice和Correct-n-Contrast。

  • 结果提示,通过像MARG-CTRL这样的损失函数改变归纳偏差,使其更适合感知任务,可以消除昂贵的捷径缓解过程的需要,总的来说,本文强调了选择适当的归纳偏差的重要性,而不是将数据集变化视为捷径的原因。

动机:默认的梯度下降优化方法(default-ERM)在处理感知任务时会出现“捷径学习”现象,即模型倾向于依赖于不稳定的相关性(捷径)而不是稳定特征,导致性能下降。本文探索为什么default-ERM会偏好捷径而不是稳定特征,并提出一种新的归纳偏差方法来解决这个问题。 方法:首先通过研究线性感知任务,证明了default-ERM对于最大边界解的偏好会导致模型更依赖于捷径而不是稳定特征,即使在线性模型的参数少于数据点的情况下也是如此。然后,提出一种归纳偏差方法,即鼓励统一边界解的损失函数(MARG-CTRL),通过这种方法可以缓解捷径学习现象,并在多个视觉和语言任务上进行了实验证明其有效性。 优势:通过深入研究default-ERM的偏好和归纳偏差,提出一种新方法(MARG-CTRL)来解决捷径学习问题,而无需昂贵的两阶段缓解方法或捷径特征标注。此外,本文还证明了MARG-CTRL在感知任务中的表现与更昂贵的方法相当或更好。

通过研究感知任务中的捷径学习现象,发现默认的梯度下降优化方法(default-ERM)对最大边界解的偏好导致模型更依赖于捷径而不是稳定特征,提出一种新的归纳偏差方法(MARG-CTRL)来缓解这一问题,并在多个任务上取得了良好的效果。

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 9 月
 123
45678910
11121314151617
18192021222324
252627282930  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议 梦晨 2025-12-11 15:33:51 来源:量子位 A...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1 十三 2025-12-15 14:13:14 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了 衡宇 2025-12-10 12:3...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案 十三 2025-12-10 1...
九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局 量子位的朋友们 2025-12-10 18:...
乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头 梦瑶 2025-12-10 20:41:15 来源:量子位 梦瑶 发自 ...