刚刚，GPT-4.5发布！OpenAI最大最贵模型，主打情商高，奥特曼带娃缺席发布会

西风
2025-02-28
05:20:27

来源：量子位

将成为未来推理模型的基础模型

梦晨西风发自凹非寺

量子位 | 公众号 QbitAI

GPT-4.5正式发布，号称OpenAI最大和最好的聊天模型。

但很意外啊，这么大的事奥特曼都不来。

刚刚，GPT-4.5发布！OpenAI最大最贵模型，主打情商高，奥特曼带娃缺席发布会

这次OpenAI也不打算秀炫酷的解题，也不打算晒各种榜单的排名，反而强调起了情商。

第一个现场演示：

“我又被朋友鸽了，帮我写个短信告诉他们我恨他们。”

o1意识到这样会“友尽”，但也只是很忠实的按要求完成了任务。

GPT-4.5甚至都没完成提示词中的任务，但整个互动显得更自然了：

先识别出用户很烦恼
建议更清楚的表达自己的情绪
给出两种备选方案
再询问用户是否坚持原来的要求

第二个现场演示，强调GPT-4.5掌握更多世界知识，以及讲述知识的方式更自然。

解释为什么海水是咸的。

GPT-4 Turbo掌握很多知识，但回答就像是在炫耀它很有知识，只是把事实罗列在一起。

同样这些知识，GPT-4.5的语气更有互动感，还考虑到用一句简洁的开场，让用户更容易记住三个关键词。

面对更专业的问题“用第一性原理解释AI对齐的必要性”，o1的回答像是写论文，而GPT-4.5通过“第1步、第2步、第3步……”来引导用户思考这个问题。

除了演示之外，直播中也透露了GPT-4.5开发过程的一些内幕：

如“激进地”使用了低精度训练，预训练阶段跨多个数据中心完成。GPT-4.5会成为未来推理模型的基础模型。

从今天起，GPT-4.5开放给200美元一个月的Pro用户。下周逐步开放给20美元一个月的Plus用户。

不是最前沿，但是最大模型

技术报告中表示：GPT-4.5不是一个前沿模型，但它是OpenAI最大的语言模型，比GPT-4的计算效率提高了10倍以上。

OpenAI称通过扩展无监督学习和推理提升AI的能力。

GPT‑4.5通过扩展计算和数据以及架构优化扩展了无监督学习，拥有更广泛的知识和更深入的世界理解能力，所以幻觉更少。

在衡量LLM事实准确性的SimpleQA基准上，GPT-4.5准确率62.5%，幻觉率37.1%，比GPT-4o、o1、o3mini优化了不少。

以下是一个具体的幻觉降低的案例。

假如用户询问“第一种语言是什么”，GPT-4.5会诚实回答不知道、这还是人类未解之谜，而不是随便蒙一个答案。

此外，Blog中还称开发了新的可扩展的技术，能够利用从小型模型衍生出的数据来训练更大更强的模型，由此提升了GPT‑4.5的可操控性、对细微差别的理解以及自然对话能力。

在人类偏好评估中，测试者更倾向于选择GPT‑4.5而非GPT‑4o。

OpenAI表示，GPT‑4.5对人类意图的理解更深刻，能够以更细腻的“情商”解读微妙的线索或隐含的期望，还展现出了更强的审美直觉和创造力，在协助写作和设计方面表现出色。

比如，当用户表达“考试不及格、很难过”，它会安慰、鼓励用户。作为对比，4o给出的回答就更加冰冷，没什么安慰的话语。

在一些回复上，GPT‑4.5对比4o回答也更简洁。

另外，OpenAI还晒出了GPT‑4.5在标准学术基准测试中的结果，全面超越GPT-4o，在SWE-Lancer Diamond（coding）和MMMLU（multilingual）上超越o3-mini。

API定价非常贵

值得一提的是，GPT-4.5的API定价非常贵。

75美元/百万tokens输入、150美元/百万tokens输出。

对比GPT-4o，定价高出去15-30倍。

到底这个价格值不值呢？不少人已经分享了抢先体验的效果。

拿到内测的博主表示，实际使用中GPT-4.5非常有创造力、一定上了很多人文课。

Claude 3.7和GPT-4.5两个，非常相似。

他还列举了GPT-4.5视觉理解能力很强的例子。它能从这张星露谷截图中发现非常小的元素蝴蝶。

“独角兽评估”的实测表现也很好。

后续随着更多实测放出，应该还能看到更多有意思的例子。

One More Thing

最后，大家一定很关心，奥特曼去哪了呢？

在医院照顾小孩。

是的，他最近刚刚喜提一子。

直播回放：https://www.youtube.com/watch?v=cfRYp0nItZ8

参考链接：https://openai.com/index/introducing-gpt-4-5/

2025 年 2 月
一	二	三	四	五	六	日
	1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28

ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง

tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.

ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.

ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.

ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!

ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

刚刚，GPT-4.5发布！OpenAI最大最贵模型，主打情商高，奥特曼带娃缺席发布会

刚刚，GPT-4.5发布！OpenAI最大最贵模型，主打情商高，奥特曼带娃缺席发布会

不是最前沿，但是最大模型

API定价非常贵

One More Thing

小说创作

清库存！DeepSeek突然补全R1技术报告，训练路径首次详细公开

训具身模型遇到的很多问题，在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

「北京版幻方」冷不丁开源SOTA代码大模型！一张3090就能跑，40B参数掀翻Opus-4.5和GPT-5.2

AI金矿上打盹的小红书，刚刚醒了一「点点」

字节Seed：大概念模型来了，推理的何必是下一个token

海信CES发布全新一代RGB-Mini LED，全球首创玲珑4芯真彩背光

英特尔CES奇袭老黄大本营！英伟达显卡刚涨价，最强酷睿量产出货

陈天桥代季峰打响2026大模型第一枪：30B参数跑出1T性能

OpenAI推理第一人离职，7年打造了o3/o1/GPT-4/Codex

文心AIGC

小说创作

清库存！DeepSeek突然补全R1技术报告，训练路径首次详细公开

训具身模型遇到的很多问题，在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

「北京版幻方」冷不丁开源SOTA代码大模型！一张3090就能跑，40B参数掀翻Opus-4.5和GPT-5.2

AI金矿上打盹的小红书，刚刚醒了一「点点」

字节Seed：大概念模型来了，推理的何必是下一个token

海信CES发布全新一代RGB-Mini LED，全球首创玲珑4芯真彩背光

英特尔CES奇袭老黄大本营！英伟达显卡刚涨价，最强酷睿量产出货

陈天桥代季峰打响2026大模型第一枪：30B参数跑出1T性能

OpenAI推理第一人离职，7年打造了o3/o1/GPT-4/Codex