李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280,中美AI模型差距更小了

763次阅读
没有评论

李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280,中美AI模型差距更小了

12个值得关注的重点趋势

中美AI模型差距正在缩小。

由李飞飞联合领导,斯坦福大学以人为本人工智能研究所(HAI)最新发布了2025 AI Index,用整整456页追踪了2024年全球AI行业的发展趋势,并得出了这样的结论。

李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280,中美AI模型差距更小了

至今,HAI已发布了8份(含本次)AI年度报告,不过今年的这份却尤为特殊。

这是我们迄今为止最全面的版本,人工智能对社会的影响从未如此明显。

李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280,中美AI模型差距更小了

虽然报告信息量爆炸,但手快的网友已经提前为大家划了重点:

  • AI推理成本降低了280倍
  • 开源模型正在迎头赶上
  • AI基准测试成绩飙升
  • ……
李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280,中美AI模型差距更小了

话不多说,下面我们详细展开报告中提到的一些重要结论。

中美AI模型差距正在缩小

从官网消息来看,鉴于报告内容较多,HAI直接为大家挑出了其中最重要的12个结论。

我们先来看与国内最相关的部分。

中美AI模型差距正在缩小

首先就是AI模型方面,中国模型虽然数量不及美国,但质量方面已迅速缩小差距

报告显示,2024年美国机构一共开发了40个值得关注的AI模型,远高于中国开发的15个和欧洲的3个。

不过,中美模型之间的性能差异正在快速缩小。具体表现为,在MMLU和HumanEval等主要基准测试上,二者的性能差异由2023年的两位数缩小到2024年的接近相等。

同时,从中美模型过去一年在大模型竞技场中的表现也能看出这一追赶趋势:

李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280,中美AI模型差距更小了

当然,这一性能差距正在缩小的趋势也不局限于中美之间。

报告提到,排名第一和第十的模型之间的得分差距在一年内从11.9%降至5.4%,排名前两位的差距现在仅为 0.7%。

也就是说,顶尖模型之间的竞争越来越激烈。

顺带一提,国内在发表AI论文推出AI专利方面继续保持领先地位。

中国是对AI最乐观的国家

其次是在对AI的态度方面,中国始终是全球主要国家和地区中最乐观的。

报告显示,2024年中国有83%的人认为AI产品和服务利大于弊,排在后面的是印度尼西亚(80%)和泰国(77%)。

相比之下,美国(39%)、加拿大(40%)等的乐观情绪远低于国内。

不过从整体趋势来看,自2022年以来,几个之前对AI持怀疑态度的国家乐观情绪增长显著,比如美国(+4%)、加拿大(+8%)、法国(+10%)等等。

李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280,中美AI模型差距更小了

除了以上两点,还有一些AI整体趋势变化也值得关注。

AI基准测试成绩飙升,表现逐渐接近人类

一个比较符合大家日常感受的结论是:AI模型在各大基准测试上的得分越来越高了

报告显示,研究人员在2023年引入了一些如今大家已耳熟能详的基准——MMMU、GPQA和SWE-bench,以此测试更高级AI模型的能力极限。

然而仅仅一年之后,从测试得分来看,其性能呈现大幅提升趋势,分别在MMMU、GPQA和SWE-bench上提高了18.8、48.9和67.3个百分点。

从整体趋势来看,AI各大能力表现逐渐接近人类,甚至在某些场景下,智能体能在限时编程任务中超越人类。

李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280,中美AI模型差距更小了

推理成本下降了280倍,开源模型正在迎头赶上

另一个符合大家印象的趋势是:AI正变得更加高效、经济实惠和易于获取。

过去两年间,追求更具性价比的小模型逐渐成为一股潮流

比如报告中提到的,在MMLU中得分超过60%的小模型:

李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280,中美AI模型差距更小了

数据显示,由越来越强大的小模型驱动,对于性能达到GPT-3.5水平的系统的推理成本,在2022年11月到2024年10月间下降了280倍

遗憾的是,复杂推理仍然面临挑战。

截至目前,AI模型在国际数学奥林匹克竞赛问题等任务中表现出色,但仍无法很好应对PlanBench等复杂推理基准测试。

李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280,中美AI模型差距更小了

不过与此同时,开源模型也在缩小与闭源模型的差距。

报告中特意提到,在某些基准测试中,它们一年内的性能差异就从8%减少到仅1.7%。

另外在硬件层面,成本每年下降30%,而能效每年提高40%。

以上趋势共同降低了人们获取高级AI的门槛。

AI正在融入日常生活,企业投资增长强劲

正是由于AI获取门槛降低,我们的日常生活也逐渐被AI改写。

报告显示,从医疗保健到交通运输,AI正迅速从实验室走向日常生活。

比如2023年,美国FDA批准了223种AI医疗设备,而2015年仅为6种。

另外在自动驾驶方面,美国最大的运营商之一Waymo每周提供超过15万次自动驾驶出行,而百度的经济型“萝卜快跑” (Apollo Go)自动驾驶出租车车队现在已在中国多个城市提供服务。

李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280,中美AI模型差距更小了

整体而言,AI的应用落地正在加速

2024年,有78%的组织报告自己正在使用AI,这比前一年增长了55%。

李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280,中美AI模型差距更小了

当然,以上服务也离不开企业对AI的大力投资。

报告显示,2024年美国对AI的投资为1091亿美元,这几乎是中国(93亿美元)的12倍和英国(45亿美元)的24倍。

其中生成式AI尤其强劲,吸引了全球私营投资339亿美元,这一数字比2023年增长了18.7%。

BTW,除了上述主要结论,报告还提到了:

  • 各国政府正在加强对AI的监管和投资;
  • 负责任的AI生态系统正在不断发展,但不均衡;
  • 目前有2/3的国家提供或计划提供K-12计算机科学教育(数量是2019年的两倍),其中非洲和拉丁美洲的进步最大;
  • 2024年近90%的知名AI模型来自工业界,高于前一年的60%。

感兴趣可以进一步查阅原报告。

报告下载地址:
https://hai-production.s3.amazonaws.com/files/hai_ai_index_report_2025.pdf

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 4 月
 123456
78910111213
14151617181920
21222324252627
282930  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law 一水 2025-12...
天下苦SaaS已久,企业级AI得靠「结果」说话

天下苦SaaS已久,企业级AI得靠「结果」说话

天下苦SaaS已久,企业级AI得靠「结果」说话 Jay 2025-12-22 13:46:04 来源:量子位 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山

库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山

库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山 衡宇 2025-12-21 10:...
清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026

清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026

清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026 Jay 2025...
奥迪+华为=油车智能天花板?

奥迪+华为=油车智能天花板?

Failed to fetch content Read More 
LeCun离职前的吐槽太猛了

LeCun离职前的吐槽太猛了

LeCun离职前的吐槽太猛了 一水 2025-12-21 19:13:08 来源:量子位 “LLM到不了AGI...
自变量王潜:具身智能是物理世界的独立基础模型|MEET2026

自变量王潜:具身智能是物理世界的独立基础模型|MEET2026

自变量王潜:具身智能是物理世界的独立基础模型|MEET2026 一水 2025-12-21 19:11:12 ...