Claude 4被曝发布在即！被DeepSeek逼得都把大招拿出来了

衡宇
2025-02-14
15:16:45

来源：量子位

通用+推理二合一，手动调节思考时长

衡宇发自凹非寺

量子位 | 公众号 QbitAI

终于！终于！Claude 4被曝将在未来几周内发布！

高亮重点，最新的它采取了一个与之前模型路线不同的办法：

是个混合型大模型。

简单来说，就是既带有推理能力，会使用更多的算力来思考和解决难题；在面对简单问题的时候，又能像传统大模型一样短平快地轻巧处理，无需多费不必要的功夫。

怎么样，听起来是不是和昨天奥特曼透露的GPT-5非常类似（doge）。

都是不再把传统通用模型和推理模型分开推出，直接融合在一起。

据透露，Anthropic计划在未来几周内发布该模型。

而翻遍互联网发现，4天前就有人按捺不住，在推特上剧透过：

Anthropic内部员工告诉我，他们将在本周内发布Claude 4，以及一个推理模型。
至于性能嘛，超过满血o3！

俗话说得好：传言有出入，期待需谨慎。

但还是禁不住狠狠期待一下！

下面一起来看更详细的剧透——

Claude 4不走老路，可控制使用时的推理成本

如前所述，Claude 4与此前的通用大模型不同。

它把通用模型和推理模型融合到一起去了，会根据具体任务，调整所需算力和所需功能：

遇到复杂的问题，就启用推理能力；遇到简单的问题，就用通用模型处理。

而且用户可以自行控制，每个问题需要耗费多少token——表现出来就是我可以规定它在每个具体的问题上思考推理多长时间。

具体操作，是使用者可以通过一个游标刻度尺来调整，刻度上标注的是“完成任务所需的token数”。

如果将游标滑动到“0”，那么Claude 4就是一个传统的、不带推理能力的AI大模型。

滑动到的数值越大，所调用的算力就越多，思考推理过程就越长。

其实呢，OpenAI现在的模型也有类似功能。

不过OpenAI只分了“低-中-高”三档，供用户选择推理强度。

但讲道理，很难预测模型在每一档位实际上会用掉多少tokens，所以很多用户反馈“三个档位并不能很好地控制使用成本”。

不过，这可能和OpenAI和Anthropic的市场定位有关系。

OpenAI更多针对的是普通用户和个人开发者，三档式更简单易懂，方便操作。

而Anthropic更注重企业级市场，相对来说toB一些，所以采用了游标刻度尺来调整，让使用者控制成本、速度等。

推理通用二合一，下一个大趋势？

可以看到，国外大模型的两个最强玩家，Anthropic和OpenAI，都明确了下一步道路：

让通用模型和推理模型合二为一。

几周内将发布的Claude 4如此，数月内将发布的GPT-5也是如此。

这或许是所有基座大模型玩家的下一步共同选择也未可知——

当传统Scaling Law撞墙成为一个强共识，而后训练、推理、CoT的重要性与日俱增时，推理变成通用模型的必需技能，似乎是大势所趋。

不过在这中间，Anthropic有属于自己的牢固生态位，那就是它旗下的Claude系列，编程能力一直站在第一梯队的顶尖。

而且它擅长的是大厂工程师所需级别的编程任务。

举个例子，Claude系列更擅长理解由数千个文件组成的复杂代码库，并生成就能正常运行的完整代码，且一次成功。

这就非常有意思了～

因为在面对复杂编程问题时，AI大模型往往会偷懒，仅提供注释，而不是吐出实际代码。

不过，现在还不清楚Claude 4将如何定价。

会比o3-mini便宜吗？会比DeepSeek-R1便宜吗？会比Google 2.0 Flash-Lite便宜吗？

暂时还没人知道。

不过有网友说出了大多数人的心声：

如果花1000美元还解决不了我想解决的问题，那不是纯纯浪费钱吗。

说白了，如果不是在某项实用能力上有「傲视群雄的拔尖实力」，或许所有模型玩家在定价这一part上能做的，就是像DeepSeek和Google 2.0 Flash-Lite一样。

（忍痛）对着价格先狠狠砍一刀，然后再砍一刀，再砍一刀……

参考资料：
[1]https://x.com/iruletheworldmo/status/1888978299159756878
[2]https://x.com/kimmonismus/status/1890056488774676697

2025 年 2 月
一	二	三	四	五	六	日
	1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28

ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง

tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.

ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.

ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.

ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!

ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

Claude 4被曝发布在即！被DeepSeek逼得都把大招拿出来了

Claude 4被曝发布在即！被DeepSeek逼得都把大招拿出来了

Claude 4不走老路，可控制使用时的推理成本

推理通用二合一，下一个大趋势？

小说创作

清库存！DeepSeek突然补全R1技术报告，训练路径首次详细公开

训具身模型遇到的很多问题，在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

「北京版幻方」冷不丁开源SOTA代码大模型！一张3090就能跑，40B参数掀翻Opus-4.5和GPT-5.2

AI金矿上打盹的小红书，刚刚醒了一「点点」

字节Seed：大概念模型来了，推理的何必是下一个token

海信CES发布全新一代RGB-Mini LED，全球首创玲珑4芯真彩背光

英特尔CES奇袭老黄大本营！英伟达显卡刚涨价，最强酷睿量产出货

陈天桥代季峰打响2026大模型第一枪：30B参数跑出1T性能

OpenAI推理第一人离职，7年打造了o3/o1/GPT-4/Codex

文心AIGC

小说创作

清库存！DeepSeek突然补全R1技术报告，训练路径首次详细公开

训具身模型遇到的很多问题，在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

「北京版幻方」冷不丁开源SOTA代码大模型！一张3090就能跑，40B参数掀翻Opus-4.5和GPT-5.2

AI金矿上打盹的小红书，刚刚醒了一「点点」

字节Seed：大概念模型来了，推理的何必是下一个token

海信CES发布全新一代RGB-Mini LED，全球首创玲珑4芯真彩背光

英特尔CES奇袭老黄大本营！英伟达显卡刚涨价，最强酷睿量产出货

陈天桥代季峰打响2026大模型第一枪：30B参数跑出1T性能

OpenAI推理第一人离职，7年打造了o3/o1/GPT-4/Codex