何恺明新作:给扩散模型加正则化,无需预训练无需数据增强,超简单实现性能提升

437次阅读
没有评论

何恺明新作:给扩散模型加正则化,无需预训练无需数据增强,超简单实现性能提升

可以即插即用

鱼羊 发自 凹非寺

量子位 | 公众号 QbitAI

扩散模型风头正盛,何恺明最新论文也与此相关。

研究的是如何把扩散模型和表征学习联系起来——

给扩散模型加上“整理收纳”功能,使其内部特征更加有序,从而生成效果更加自然逼真的图片。

何恺明新作:给扩散模型加正则化,无需预训练无需数据增强,超简单实现性能提升

具体来说,论文提出了Dispersive Loss——一种即插即用的正则化方法。

核心思想是,在模型输出的标准回归损失(如去噪)外,引入一个目标函数,用于对模型的中间表示进行正则化。

这有点类似于对比学习中的排斥效应。但相较于对比学习,其独特的优势在于:

  • 无需正样本对,避免了对比学习中的复杂性;
  • 具有高度通用性,可以直接应用于现有扩散模型,不需要修改模型结构;
  • 计算开销低,几乎不增加额外的计算成本;
  • 与原始损失兼容,不干扰扩散模型原有的回归训练目标,易于在现有框架中集成。

让中间表示在隐藏空间中分散

一起来看论文细节。

何恺明和合作者Runqian Wang的出发点有三:

  • 扩散模型的局限性

扩散模型在生成复杂数据分布方面表现出色,但其训练通常依赖于基于回归的目标函数,缺乏对中间表示的明确正则化。

  • 表征学习的启发

表征学习(特别是对比学习)通过鼓励相似样本靠近、不同样本分散,能有效学习通用表示。

对比学习在分类、检测等任务中已经取得成功,但在生成任务中的潜力尚未被充分探索。

  • 现有方法的不足

REPA(表征对齐)等现有方法尝试通过对齐生成模型的中间表示和预训练表示来改进生成效果,但存在依赖外部数据、额外模型参数和预训练过程的问题,代价高昂且复杂。

他们开始考虑,如何借鉴对比自监督学习,鼓励生成模型的中间表示在隐藏空间中分散,从而提高模型的泛化能力和生成质量。

何恺明新作:给扩散模型加正则化,无需预训练无需数据增强,超简单实现性能提升

基于这样的核心思想,他们设计Dispersive Loss:通过正则化模型的中间表示,增大中间表示的分散性,使其在隐藏空间中分布得更加均匀。

与对比学习的不同之处在于,在对比学习中,正样本对需要通过数据增强等方法手动定义,并通过损失函数将正样本对拉近、负样本对分开。

Dispersive Loss则不需要定义正样本对,仅通过鼓励负样本对之间的分散性来实现正则化。

对于一批输入样本

何恺明新作:给扩散模型加正则化,无需预训练无需数据增强,超简单实现性能提升

,Dispersive Loss的目标函数可以表示为:

何恺明新作:给扩散模型加正则化,无需预训练无需数据增强,超简单实现性能提升

其中,

何恺明新作:给扩散模型加正则化,无需预训练无需数据增强,超简单实现性能提升

是单个样本的标准扩散损失,

何恺明新作:给扩散模型加正则化,无需预训练无需数据增强,超简单实现性能提升

为分散损失项,即正则化项,λ为正则化强度,用于平衡扩散损失和分散损失的权重。

可以看到,Dispersive Loss的实现非常简洁,不需要额外的样本对或复杂操作,可以直接作用于模型的中间层表示。

并且不仅支持单层应用,也支持多层叠加——理论上可以在多个中间层同时应用Dispersive Loss,进一步增强不同层级特征的分散性。

实验结果

作者在ImageNet上,使用DiT和SiT作为基线模型,对不同规模的模型进行了广泛测试。

结果显示,Dispersive Loss在所有模型和设置中均提高了生成质量。比如,在SiT-B/2模型上,FID从36.49降到了32.45。

何恺明新作:给扩散模型加正则化,无需预训练无需数据增强,超简单实现性能提升

与REPA方法相比,Dispersive Loss不依赖预训练模型或外部数据,生成质量则并不逊色。

在SiT-XL/2 模型上,Dispersive Loss的FID为1.97,而REPA的FID为1.80。

何恺明新作:给扩散模型加正则化,无需预训练无需数据增强,超简单实现性能提升

另外,无论是多步扩散模型还是单步生成模型,都能基于Dispersive Loss得到明显改进。

何恺明新作:给扩散模型加正则化,无需预训练无需数据增强,超简单实现性能提升

作者认为,不仅是在图像生成任务上,Dispersive Loss在图像识别等其他任务上也具有潜力。

论文地址:
https://arxiv.org/abs/2506.09027v1

— 完 —

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 6 月
 1
2345678
9101112131415
16171819202122
23242526272829
30  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议 梦晨 2025-12-11 15:33:51 来源:量子位 A...
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1 十三 2025-12-15 14:13:14 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了 衡宇 2025-12-10 12:3...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案 十三 2025-12-10 1...
九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局 量子位的朋友们 2025-12-10 18:...
乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头 梦瑶 2025-12-10 20:41:15 来源:量子位 梦瑶 发自 ...