备受Meta折磨,LeCun依旧猛发论文!新作:JEPAs不只学特征,还能精准感知数据密度

346次阅读
没有评论

备受Meta折磨,LeCun依旧猛发论文!新作:JEPAs不只学特征,还能精准感知数据密度

仍然和三位FAIR同事合作

闻乐 发自 凹非寺

量子位 | 公众号 QbitAI

备受Meta审核规定“折磨”,依旧猛发论文!

表示可能要辞职的LeCun带着最新研究来了,仍然和三位FAIR同事合作。

Yann LeCun团队新论文发现了自监督模型JEPAs(联合嵌入预测架构)的隐藏技能——

学会了数据的“密度”

这里的“数据密度”可以理解成数据的常见程度:密度高的样本是更典型、更常见的数据,密度低的是少见的、甚至异常的数据。

备受Meta折磨,LeCun依旧猛发论文!新作:JEPAs不只学特征,还能精准感知数据密度

JEPAs原本被视为仅擅长特征提取的模型,这次LeCun团队发现该模型在训练过程中悄悄掌握了感知数据常见程度的能力。

这就意味着,只要JEPAs训练成功了,不用额外做什么,就能用它来判断一个样本的常见程度

打破了学界长期以来“JEPAs仅学特征、与数据密度无关”的认知。

核心发现:反坍缩能精准学习数据密度

要理解这一新发现的突破,首先来说一下JEPAs。

备受Meta折磨,LeCun依旧猛发论文!新作:JEPAs不只学特征,还能精准感知数据密度△源自《A Path Towards Autonomous Machine Intelligence》图12

JEPAs作为LeCun团队近年重点推进的自监督学习框架,核心优势在于无需人工标注,模型就能自主从海量数据中学习特征规律,学完后就可以直接适配图像识别、跨模态匹配等下游任务,是AI领域高效学习的代表性模型。

备受Meta折磨,LeCun依旧猛发论文!新作:JEPAs不只学特征,还能精准感知数据密度

此前学界普遍认为,JEPAs的训练只有两个核心目标:

  • 一是latent空间预测。即给原始数据(如图像)做轻微扰动(裁剪、调色)后,扰动数据的特征表示(模型内部理解的数据形态)能从原始数据特征中精准预测;
  • 二是反坍缩。防止所有样本的特征趋同一致。

而论文的新发现就是从反坍缩中得来。

如果所有数据的特征都一样,模型相当于白学,所以过去大家都将反坍缩单纯视为避免特征失效的保障手段,没有意识到它还有更深层的作用。

LeCun团队就聚焦于反坍缩的的隐藏价值,研究通过变量替换公式高维统计特性推导证明,反坍缩不仅能防止特征坍缩,更能让JEPAs精准学习数据密度

从理论层面看,当JEPAs输出高斯嵌入(高维空间中近似均匀分布于超球面的特征)时,模型必须通过雅可比矩阵(反映模型对样本微小变化的响应程度)感知数据密度,才能满足训练时的约束条件,这意味着学习数据密度并不是偶然,而是JEPAs训练过程中的必然结果

备受Meta折磨,LeCun依旧猛发论文!新作:JEPAs不只学特征,还能精准感知数据密度

为了让这种隐藏的密度感知能力落地实用,团队还提出了关键工具JEPA-SCORE

这是从JEPAs 中提取数据密度的量化指标,核心作用就是给样本的常见度打分

备受Meta折磨,LeCun依旧猛发论文!新作:JEPAs不只学特征,还能精准感知数据密度

根据公式来看计算逻辑简洁高效,只需要获取JEPAs处理目标样本时的雅可比矩阵,计算矩阵的特征值后取对数求和,得到的结果就是JEPA-SCORE,分数越高说明样本越典型(数据密度高),分数越低则样本越罕见或异常(数据密度低)。

更重要的是,JEPA-SCORE还具备极强的通用性,无限制适配,既不挑数据集,也不挑JEPAs架构

无论是ImageNet、手写数字MNIST,还是未参与预训练的陌生数据(星云图集),都能精准计算;

不管是I-JEPA、DINOv2(单模态视觉模型),还是MetaCLIP(多模态模型),只要是成功训练的JEPAs家族模型,都能直接使用,且无需额外训练模型。

为了验证这一发现的可靠性,团队还开展了多组实验。

在ImageNet数据集中,不同JEPAs模型对典型样本(如飞行姿态的鸟类)和罕见样本(如栖息姿态的鸟类)的JEPA-SCORE判定高度重合,证明这是JEPAs的共性能力,并不是某个模型的偶然;

面对未参与预训练的星系图像数据集,其JEPA-SCORE显著低于ImageNet数据,说明模型能精准识别陌生数据;

备受Meta折磨,LeCun依旧猛发论文!新作:JEPAs不只学特征,还能精准感知数据密度

而在数据筛选和异常检测的实用测试中,JEPA-SCORE的效果也优于传统方法。

备受Meta折磨,LeCun依旧猛发论文!新作:JEPAs不只学特征,还能精准感知数据密度△数据筛选场景
备受Meta折磨,LeCun依旧猛发论文!新作:JEPAs不只学特征,还能精准感知数据密度△异常检测场景

研究团队

此次研究并非LeCun一人之功。

另外三位核心研究者也都是Meta FAIR的研究员。

Randall Balestriero是布朗大学计算机科学助理教授,长期深耕人工智能与深度学习领域。

备受Meta折磨,LeCun依旧猛发论文!新作:JEPAs不只学特征,还能精准感知数据密度

2013年起研究可学习信号处理,他参与的技术曾用于NASA火星车火星地震探测。

2021年获莱斯大学博士学位,后进入Meta AI做博士后,师从Yann LeCun。

Nicolas Ballas拥有法国格勒诺布尔大学博士学位。

2010年4月至9月,他担任了LTU Technologies的研发实习生,从事应用于图像检索的大规模聚类相关工作。

自2017年起,他在FAIR担任研究科学家,已任职超过8年。

Michael Rabbat是FAIR的创始成员,拥有伊利诺伊大学厄巴纳-香槟分校的工程学士学位、莱斯大学的工程硕士学位,以及威斯康星大学麦迪逊分校的电气工程博士学位。

备受Meta折磨,LeCun依旧猛发论文!新作:JEPAs不只学特征,还能精准感知数据密度

他的研究方向聚焦于优化算法、分布式算法及信号处理三大领域。

加入Meta之前,Mike曾担任麦吉尔大学电气与计算机工程系教授。

论文地址:https://arxiv.org/abs/2510.05949

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 10 月
 12345
6789101112
13141516171819
20212223242526
2728293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议 梦晨 2025-12-11 15:33:51 来源:量子位 A...
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1 十三 2025-12-15 14:13:14 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了 衡宇 2025-12-10 12:3...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案 十三 2025-12-10 1...
九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局 量子位的朋友们 2025-12-10 18:...
乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头 梦瑶 2025-12-10 20:41:15 来源:量子位 梦瑶 发自 ...