MetaAI提出DIFFMAE：扩散模型与MAE的首次结合

1,744次阅读

长期以来一直存在一种信念，即生成可以促进对视觉数据的真正理解。为了符合这一观点，本文重新审视了在最近对去噪扩散模型产生了兴趣的情况下，针对生成式预训练视觉表示的方法。虽然直接使用扩散模型进行预训练并不能产生强大的表示，但本文将扩散模型作为掩蔽输入的条件，并将扩散模型形式化为掩蔽自编码器（DiffMAE）。本文的方法能够(i) 作为下游识别任务的强大初始化，(ii) 进行高质量的图像修复，(iii) 轻松扩展到视频并产生最先进的分类准确性。本文进一步对设计选择的优缺点进行了全面研究，并在扩散模型和掩蔽自编码器之间建立了联系。

总结：

本文中提出了一种新的方法，将扩散模型作为掩蔽自编码器（DiffMAE），以实现对视觉数据的生成式预训练表示。通过对掩蔽输入的条件，该方法能够产生强大的表示，不仅能作为下游识别任务的强大初始化，还能进行高质量的图像修复，并轻松扩展到视频，并产生最先进的分类准确性。本文进一步对设计选择的优缺点进行了全面研究，并在扩散模型和掩蔽自编码器之间建立了联系。

标题：Diffusion Models as Masked Autoencoders

作者：Chen Wei, Karttikeya Mangalam, Po-Yao Huang, Yanghao Li, Haoqi Fan, Hu Xu, Huiyu Wang Cihang Xie, Alan Yuille, Christoph Feichtenhofer

平台：https://weichen582.github.io/diffmae.html

MetaAI提出DIFFMAE：扩散模型与MAE的首次结合

正文完

可以使用微信扫码关注公众号（ID：xzluomor）

AI AR F1 HTML RSS 视频设计

发表至：智源

2023年4月7日

可以取代NMS？IOU感知校准，取代NMS，成就YOLOX等目标检测更快的后处理方法

清华大学等提出一个大规模多模态预训练模型用于电子商务

“宝藏AI神器”通义听悟上新：超长音视频随便问，高校师生可获500小时免费时长

终于等到华为对YOLO出手，提出Gold-YOLO | 超越YOLOv8/YOLOv6/YOLOv7

腾讯：零样本多模态标签的大语言模型TagGPT

微软 | 用GPT-4进行指令调优

评论（没有评论）

2023 年 4 月
一	二	三	四	五	六	日
	1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

文心AIGC

人工智能ChatGPT，AIGC指利用人工智能技术来生成内容，其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向，近几年迭代速度呈现指数级爆发，谷歌、Meta、百度等平台型巨头持续布局

文章搜索

最新评论

ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง

tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.

ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.

ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.

ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!

ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

经典留声机

经典流行从来都不冲突

在这里，听见你曾经的故事

新浪微博：主播小D

小红书：小D就是我

抖音号：52915017

Search Episodes

薛之谦：从“人歌分离”到“深情解构者”的音乐涅槃之路（上）

2025年6月30日

主播小D

你一定听过这些经典合唱–第一篇

2025年1月20日

主播小D

缅怀一代歌王罗文的经典之声–第二篇

2024年12月30日

主播小D

缅怀一代歌王罗文的经典之声–第一篇

2024年12月27日

主播小D

在这里，听琼瑶，岁月长歌–第二篇

2024年12月24日

主播小D

在这里，听琼瑶，岁月长歌–第一篇

2024年12月21日

主播小D

你总能在这些歌里找到你的回忆–第一百零三篇

2024年12月18日

主播小D

你总能在这些歌里找到你的回忆–第一百零四篇

2024年12月13日

主播小D

《这些歌都发行在2001年–第三篇》

2024年12月10日

主播小D

《这些歌都发行在2001年–第二篇》

2024年12月7日

主播小D

Search Results placeholder

2023 年 4 月
一	二	三	四	五	六	日
	1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30