Claude 4被曝发布在即!被DeepSeek逼得都把大招拿出来了
通用+推理二合一,手动调节思考时长
衡宇 发自 凹非寺
量子位 | 公众号 QbitAI
终于!终于!Claude 4被曝将在未来几周内发布!
高亮重点,最新的它采取了一个与之前模型路线不同的办法:
是个混合型大模型。
简单来说,就是既带有推理能力,会使用更多的算力来思考和解决难题;在面对简单问题的时候,又能像传统大模型一样短平快地轻巧处理,无需多费不必要的功夫。
![Claude 4被曝发布在即!被DeepSeek逼得都把大招拿出来了 Claude 4被曝发布在即!被DeepSeek逼得都把大招拿出来了](https://www.qbitai.com/wp-content/uploads/replace/2b606203aa4e97aa713b1d30a0fee584.jpeg)
怎么样,听起来是不是和昨天奥特曼透露的GPT-5非常类似(doge)。
都是不再把传统通用模型和推理模型分开推出,直接融合在一起。
据透露,Anthropic计划在未来几周内发布该模型。
而翻遍互联网发现,4天前就有人按捺不住,在推特上剧透过:
Anthropic内部员工告诉我,他们将在本周内发布Claude 4,以及一个推理模型。
至于性能嘛,超过满血o3!
![Claude 4被曝发布在即!被DeepSeek逼得都把大招拿出来了 Claude 4被曝发布在即!被DeepSeek逼得都把大招拿出来了](https://www.qbitai.com/wp-content/uploads/replace/2e24c5ac0aa9394559b576ea853824cc.jpeg)
俗话说得好:传言有出入,期待需谨慎。
但还是禁不住狠狠期待一下!
下面一起来看更详细的剧透——
Claude 4不走老路,可控制使用时的推理成本
如前所述,Claude 4与此前的通用大模型不同。
它把通用模型和推理模型融合到一起去了,会根据具体任务,调整所需算力和所需功能:
遇到复杂的问题,就启用推理能力;遇到简单的问题,就用通用模型处理。
而且用户可以自行控制,每个问题需要耗费多少token——表现出来就是我可以规定它在每个具体的问题上思考推理多长时间。
具体操作,是使用者可以通过一个游标刻度尺来调整,刻度上标注的是“完成任务所需的token数”。
如果将游标滑动到“0”,那么Claude 4就是一个传统的、不带推理能力的AI大模型。
滑动到的数值越大,所调用的算力就越多,思考推理过程就越长。
![Claude 4被曝发布在即!被DeepSeek逼得都把大招拿出来了 Claude 4被曝发布在即!被DeepSeek逼得都把大招拿出来了](https://www.qbitai.com/wp-content/uploads/replace/73469819404b7e2ea773d907d8523b4f.gif)
其实呢,OpenAI现在的模型也有类似功能。
不过OpenAI只分了“低-中-高”三档,供用户选择推理强度。
但讲道理,很难预测模型在每一档位实际上会用掉多少tokens,所以很多用户反馈“三个档位并不能很好地控制使用成本”。
不过,这可能和OpenAI和Anthropic的市场定位有关系。
OpenAI更多针对的是普通用户和个人开发者,三档式更简单易懂,方便操作。
而Anthropic更注重企业级市场,相对来说toB一些,所以采用了游标刻度尺来调整,让使用者控制成本、速度等。
![Claude 4被曝发布在即!被DeepSeek逼得都把大招拿出来了 Claude 4被曝发布在即!被DeepSeek逼得都把大招拿出来了](https://www.qbitai.com/wp-content/uploads/replace/e8e269d05680c68416ce4b34e9ad879c.jpeg)
推理通用二合一,下一个大趋势?
可以看到,国外大模型的两个最强玩家,Anthropic和OpenAI,都明确了下一步道路:
让通用模型和推理模型合二为一。
几周内将发布的Claude 4如此,数月内将发布的GPT-5也是如此。
这或许是所有基座大模型玩家的下一步共同选择也未可知——
当传统Scaling Law撞墙成为一个强共识,而后训练、推理、CoT的重要性与日俱增时,推理变成通用模型的必需技能,似乎是大势所趋。
![Claude 4被曝发布在即!被DeepSeek逼得都把大招拿出来了 Claude 4被曝发布在即!被DeepSeek逼得都把大招拿出来了](https://www.qbitai.com/wp-content/uploads/replace/e037bbea8acaf16aa683abf98f450b2a.jpeg)
不过在这中间,Anthropic有属于自己的牢固生态位,那就是它旗下的Claude系列,编程能力一直站在第一梯队的顶尖。
而且它擅长的是大厂工程师所需级别的编程任务。
举个例子,Claude系列更擅长理解由数千个文件组成的复杂代码库,并生成就能正常运行的完整代码,且一次成功。
这就非常有意思了~
因为在面对复杂编程问题时,AI大模型往往会偷懒,仅提供注释,而不是吐出实际代码。
不过,现在还不清楚Claude 4将如何定价。
会比o3-mini便宜吗?会比DeepSeek-R1便宜吗?会比Google 2.0 Flash-Lite便宜吗?
暂时还没人知道。
不过有网友说出了大多数人的心声:
如果花1000美元还解决不了我想解决的问题,那不是纯纯浪费钱吗。
![Claude 4被曝发布在即!被DeepSeek逼得都把大招拿出来了 Claude 4被曝发布在即!被DeepSeek逼得都把大招拿出来了](https://www.qbitai.com/wp-content/uploads/replace/481672deabe86e29a7b8b38f974febe3.jpeg)
说白了,如果不是在某项实用能力上有「傲视群雄的拔尖实力」,或许所有模型玩家在定价这一part上能做的,就是像DeepSeek和Google 2.0 Flash-Lite一样。
(忍痛)对着价格先狠狠砍一刀,然后再砍一刀,再砍一刀……
参考资料:
[1]https://x.com/iruletheworldmo/status/1888978299159756878
[2]https://x.com/kimmonismus/status/1890056488774676697
![post-qrcode](https://aigc.luomor.com/wp-content/uploads/2023/03/qrcode_for_gh_ada6dea0c7e9_258.jpeg)