谷歌Gemini 3把GPT-5.1打成计量单位!马斯克奥特曼都服了

158次阅读
没有评论

谷歌Gemini 3把GPT-5.1打成计量单位!马斯克奥特曼都服了

全新智能体开发平台,杀入AI编程赛场

梦晨 闻乐 发自 凹非寺

量子位 | 公众号 QbitAI

不得了。

谷歌Gemini 3 Pro进步太大了,与上一代2.5 Pro之间差出一个GPT-5.1(狗头)。

新模型在几乎所有基准测试中超过GPT-5.1和Claude4.5,包括人类最后的考试、ARC-AGI-2这些专为AGI准备的测试,数学的AIME 2025带工具拿满分,还刷新了之前让大模型全员得0分的LiveCodeBench Pro纪录。

谷歌Gemini 3把GPT-5.1打成计量单位!马斯克奥特曼都服了

用户投票的大模型竞技场也是一样,马斯克的Grok4.1昨天才刷完榜,今天就被反超了。

谷歌Gemini 3把GPT-5.1打成计量单位!马斯克奥特曼都服了

这下奥特曼和马斯克也不得不佩服了,前后脚出来点赞祝贺。

谷歌Gemini 3把GPT-5.1打成计量单位!马斯克奥特曼都服了
谷歌Gemini 3把GPT-5.1打成计量单位!马斯克奥特曼都服了

测试期间看Gemini 3模拟Windows、Mac、Linux三大操作系统界面,还以为它只擅长设计前端呢,原来设计出的程序他真能用啊。

设计一个乐高编辑器,一次尝试就完成了界面+负责空间逻辑和所有编辑器功能。

谷歌Gemini 3把GPT-5.1打成计量单位!马斯克奥特曼都服了

谷歌官方用Gemini 3 Pro设计的游戏更是发布在了油管上可以直接玩,纯靠AI都能搭起一个4399小游戏网了你敢信?

在智能体任务上,Gemini 3 Pro不光擅长编程,还强化了现实生活任务的长期规划能力,模拟管理自动售货机一年赚了5000美元,取得所有模型中最高的收入。

谷歌Gemini 3把GPT-5.1打成计量单位!马斯克奥特曼都服了

从今天起,谷歌宣布“以整个公司的体量”发布Gemini 3系列模型,包括首次在发布当天就将Gemini整合进搜索,上线独立APP,还推出全新的智能体开发平台。

还有一个更强Gemini 3 Deep Think深度思考模式,正在路上。

至于这么大的能力飞跃如何实现的,只有研究VP Oriol Vinyals透露了一点:预训练还没结束,后训练也还有很大改进空间。

谷歌Gemini 3把GPT-5.1打成计量单位!马斯克奥特曼都服了

Gemini系列的集大成者

回看Gemini系列这几年的演进,有点像打怪升级了,每一代都在补上一代的短板,然后在下一代里又把所有能力都打磨一遍。

1代奠定根基,把多模态能力和超长上下文打通,Gemini成为第一个能够处理百万级tokens上下文的大模型。

2代就开始变得有行动力,在1代的基础上记住大量信息后,它就整合海量信息进行决策和规划,这也为智能体能力铺了路。

到了Gemini 2.5,谷歌则开始认真搞思考和推理,给它加了思考引擎,让它能做更深入的推理、链式思考,甚至模仿人类分步解决问题。

现在的3代更是能力的集大成者,不是简单堆料,而是深度融合,多模态、推理、Agent能力这些特性一起进化,主打“你敢想,我实现”。

而且,Gemini 3更明显的变化是更懂人话了。

谷歌Gemini 3把GPT-5.1打成计量单位!马斯克奥特曼都服了

不用纠结提示词是否写得“有水平”,只要把需求一丢,再长的提示词它也能抓住语境、明白意图,然后回你一句更简洁又直接的答案,没有彩虹屁的那种(doge)。

谷歌Gemini 3把GPT-5.1打成计量单位!马斯克奥特曼都服了

多模态方面更是开挂,文本、图像、视频、音频和代码一股脑地无缝理解。

比如说,给它看一段球赛的长视频,它就能总结打法,把球员技巧整理出来,然后顺便教你复现动作。

怎么感觉,上传自己的训练视频,就可以直接让Gemini 3当教练了……

谷歌Gemini 3把GPT-5.1打成计量单位!马斯克奥特曼都服了

在搜索场景里,Gemini 3也不是直接扔给你一堆链接,而是把即时查询的信息组织成你真正能用的东西,生成可交互式的内容。

谷歌Gemini 3把GPT-5.1打成计量单位!马斯克奥特曼都服了

反重力开发平台,杀入AI编程战场

这次与旗舰模型Gemini 3 Pro同步推出的,还有Google Antigravity(反重力)实验性智能体开发平台。

其核心理念是构建一个“智能体优先”(agent-first)的开发环境,将开发者从繁琐的编码工作中解放出来,转向更高层次、面向任务的架构师角色。

官方展示了如何用1分钟开发一个航班追踪程序。

谷歌Gemini 3把GPT-5.1打成计量单位!马斯克奥特曼都服了

与Cursor为代表的AI IDE相比,Google Antigravity的智能体已被提升到一个独立的界面,并可直接访问编辑器、终端和浏览器。智能体可以代表用户自主规划和执行复杂的端到端软件任务,同时验证自身的代码。

全新的管理器视图旨在同时控制多个智能体,使每个智能体都能更加自主地工作。

谷歌Gemini 3把GPT-5.1打成计量单位!马斯克奥特曼都服了

谷歌对这款开发工具的野心很大,他不仅支持Gemini系列模型,也允许使用GPT-OSS、Claude第三方模型。

Antigravity目前以公共预览版的形式免费提供,并承诺为Gemini 3 Pro的使用提供“慷慨的速率限制”,一发布就吸引了大量开发者来“薅羊毛”。

目前Claude Code收入占Anthropic总营收约21%,OpenAI也在不断围绕Codex做文章。

AI编程工具,看来是下一个必争之地了。

参考链接:
[1]https://blog.google/products/gemini/gemini-3/#learn-anything

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 11 月
 12
3456789
10111213141516
17181920212223
24252627282930
loader-image
北京
Beijing, CN
10:53 上午, 9 1 月, 2026
1°C
broken clouds
35 %
1013 mb
1 mph
Wind Gust: 1 mph
Clouds: 63%
可见性: 10 km
日出: 7:35 am
日落: 5:06 pm
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
共推空天领域智能化升级!趋境科技与金航数码强强联手

共推空天领域智能化升级!趋境科技与金航数码强强联手

共推空天领域智能化升级!趋境科技与金航数码强强联手 十三 2025-12-09 18:18:41 来源:量子位...
起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机” 西风 202...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东

小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东

小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东 Jay 2025-12-09 08:26:01 来源...
梁文锋,Nature全球年度十大科学人物!

梁文锋,Nature全球年度十大科学人物!

梁文锋,Nature全球年度十大科学人物! 一水 2025-12-09 09:46:23 来源:量子位 来自安...
起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机” 西风 202...
摩尔线程新一代GPU架构10天后发布

摩尔线程新一代GPU架构10天后发布

摩尔线程新一代GPU架构10天后发布 思邈 2025-12-09 15:46:09 来源:量子位 国内首个聚焦...
极客公园创新大会 2026在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」

极客公园创新大会 2026在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」

极客公园创新大会 2026在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」 henry 2...