清华唐杰:领域大模型,伪命题

59次阅读
没有评论

清华唐杰:领域大模型,伪命题

8个方面的新感悟

编辑部 整理

量子位 | 公众号 QbitAI

清华教授唐杰最新在微博发表了自己关于AI的一些感悟,非常值得一读~

共八个小点,不算长篇大论,但扎实有料:

  • 基座模型继续scaling仍然高效;
  • 真实使用体验想进一步上台阶,长尾能力的对齐和推理增强绕不过去;
  • Agent代表模型开始进入环境、开始形成生产力;
  • 一旦模型进入持续交互的世界,记忆机制、在线学习、自我评估就会成为核心工程题,而不是可选项;
  • AI终究要落到替人完成工作、创造增量价值上;
  • 领域大模型是个伪命题;
  • ……

唐杰表示,发微博是想分享一下,希望对大家有用。

兹以推文刊载,供大家广泛阅读、传播。

清华唐杰:领域大模型,伪命题

以下为其感悟原文:

01,关于scaling基座模型

预训练使得大模型已经掌握世界常识知识,并且具备简单推理能力。

更多数据、更大参数和更饱和的计算仍然是scaling基座模型最高效的办法。

02,关于激活对齐和增强推理能力

激活对齐和增强推理能力,尤其是激活更全面的长尾能力是保证模型效果的另一关键,通用benchmark的出现一方面评测了模型通用效果,但也可能使得很多模型过拟合。

真实场景下是如何让模型更快、更好的对齐长尾的真实场景,增强实际体感。

mid和post training使得更多场景的快速对齐和强推理能力成为可能。

03,关于Agent

agent是模型能力扩展的一个里程碑,也是体现ai模型进入人类真实(虚拟/物理)世界的关键。

没有agent能力,大模型将停留在(理论学习)阶段,就类似一个人不断学习,哪怕学习到博士,也只是知识积累,还没有转化为生产力。

原来的agent是通过模型应用来实现,现在模型已经可以直接将agent数据集成到训练过程,增强了模型的通用性,其实难题还是不同agent环境的泛化和迁移并不是那么容易,因此最简单办法也只有不断增加不同agent环境的数据和针对不同环境的强化学习。

04,关于模型记忆

实现模型记忆成为一个必须做的事情,这也是一个模型应用到真实环境必须有的能力。

人类记忆分为短期(前额叶)、中期(海马体)、长期(分布式大脑皮层)、人类历史(wiki或史书)四个阶段。

大模型如何实现不同阶段的记忆是个关键,context、rag、模型参数可能分别对应了人类的不同记忆阶段,但如何实现是个关键,一种办法是压缩记忆,简单存在context,如果大模型可以支持足够长的context,那基本有可能实现短中长期的记忆。

如何迭代模型知识,更改模型参数这还是个难题。

05,关于在线学习与自我评估

在线学习与自我评估。

有了记忆机理,在线学习成为一个重点,目前的大模型定时重新训练,这有几个问题:

  • 模型无法真正的自我迭代,但模型的自学习自迭代一定会是下一个阶段必然具有的能力;
  • 重新训练还比较浪费,同时也会丢掉很多交互数据。

因此如何实现在线学习是个关键,自我评估是在线学习的一个关键点,要想模型自我学习,模型首先要知道自己对还是不对,如果知道了(哪怕概率知道)模型就知道了优化目标,能够自我改进。

因此构建模型自我评价机制是个难题。

这也可能是下一个scaling范式。

continual learning/real time learning/online learning?

06,关于模型研发和应用结合

最后,大模型的发展越来越端到端,不可避免的要把模型研发和模型应用结合起来。

ai模型应用的第一性不应该是创造新的app,他的本质是agi替代人类工作,因此研发替代不同工种的ai是应用的关键。

chat部分替代了搜索,部分其实融合了情感交互。

明年将是ai替代不同工种的爆发年。

07,关于多模态和具身

写在最后的是多模态和具身。

多模态肯定是个未来也很有前景,当下的问题是多模态不大能帮助到agi的智能上界,而通用agi的智能上界到底在哪儿还不知道。

可能最有效的方式还是分开发展,文本、多模态、多模态生成。

当然适度的探索这三者的结合肯定能发现一些很不一样的能力,这需要勇气和雄厚的资本支持。

同理,如果看懂了agent就知道具身的痛在哪里了,太难通用了(也不一定),但至少少样本去激活通用具身能力基本不可能。

那怎么办呢,采数据,或者合成数据,都不是那么容易,也贵。

但反之一旦数据规模上去了,通用能力出来了自然会形成门槛。

当然这只是智能方面的难题,对于具身,机器人本身也是个问题,不稳定,故障频繁都限制了具身智能的发展。

2026年这些都将取得长足进步。

08,关于领域大模型和大模型应用

也讨论一下领域大模型和大模型应用。

我一直认为领域大模型就是个伪命题,都agi了哪有什么domain-specific agi……

但,agi还没实现,领域模型会长时间存在(多长,不好说,ai发展实在太快了)。

领域模型的存在本质上是应用企业不愿意在ai企业面前认输,希望构建领域know how的护城河,不希望ai入侵,希望把ai驯化为工具。

而ai的本质是海啸,走到哪里都将一切卷了进去,一定有一些领域公司走出护城河,自然就卷进了agi的世界。

简而言之,领域的数据、流程、agent数据慢慢的都会进入主模型。

而大模型的应用也要回到第一性原理,ai不需要创建新的应用。

ai的本质是模拟人或者代替人或者帮助人实现人类的某些必须要做到事(某些工种)。

可能就是两种,一种就是ai化以前的软件,原来需要人参与的改成ai,另一种就是创造对齐人类某个工种的ai软件,替代人类工作。

所以大模型应用需要帮助到人、创造新的价值。

如果做一个ai软件没人用,不能产生价值,那这个ai软件肯定没有生命力。

参考链接:
https://weibo.com/2126427211/5247011059141988

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 12 月
1234567
891011121314
15161718192021
22232425262728
293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
共推空天领域智能化升级!趋境科技与金航数码强强联手

共推空天领域智能化升级!趋境科技与金航数码强强联手

共推空天领域智能化升级!趋境科技与金航数码强强联手 十三 2025-12-09 18:18:41 来源:量子位...
起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机” 西风 202...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东

小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东

小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东 Jay 2025-12-09 08:26:01 来源...
梁文锋,Nature全球年度十大科学人物!

梁文锋,Nature全球年度十大科学人物!

梁文锋,Nature全球年度十大科学人物! 一水 2025-12-09 09:46:23 来源:量子位 来自安...
起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机” 西风 202...
摩尔线程新一代GPU架构10天后发布

摩尔线程新一代GPU架构10天后发布

摩尔线程新一代GPU架构10天后发布 思邈 2025-12-09 15:46:09 来源:量子位 国内首个聚焦...
极客公园创新大会 2026在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」

极客公园创新大会 2026在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」

极客公园创新大会 2026在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」 henry 2...