DeepSeek V3小版本升级实测堪比V3.5,非推理模型也有“啊哈时刻”

761次阅读
没有评论

DeepSeek V3小版本升级实测堪比V3.5,非推理模型也有“啊哈时刻”

并非小版本升级

梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

DeepSeek V3升级了,新版本V3-0324。

官方轻描淡写只说是“小版本升级”,但很多人实测下来可一点也不小。

DeepSeek V3小版本升级实测堪比V3.5,非推理模型也有“啊哈时刻”

把流行的小球弹跳测试,提升难度到4维空间超立方体也没问题。

天哪,如果这只是一个小更新,那我想象不出大更新会是什么样子。

DeepSeek V3小版本升级实测堪比V3.5,非推理模型也有“啊哈时刻”

编程这块,只需一句提示词开发一个完整产品着陆页,带自适应布局带动效,被评价为与Claude 3.7 Sonnet同一水平。

DeepSeek V3小版本升级实测堪比V3.5,非推理模型也有“啊哈时刻”

由于发布时间太短,还没有正式测评结果,不过在开发者Xeophon的个人Benchmark上所有指标都有大提升,成为该测试下最好的非推理模型。

DeepSeek V3小版本升级实测堪比V3.5,非推理模型也有“啊哈时刻”

不是推理模型也有“啊哈时刻”

DeepSeek-V3-0324并非推理模型,在回答之前不会给出思考过程,但依然遵循一定的思维方式分解问题。

走入死胡同的话,还表现出自主回到上一步重新思考的能力。

在“9.11和9.9那个大”、“Straberry有多少个r”已经不成问题的今天,最新折磨AI的难题是“让7米长的甘蔗通过2米高1米宽的门”。

在量子位的测试中,DeepSeek-V3-0324先是像它的前辈以及许多其他AI一样碰壁。

DeepSeek V3小版本升级实测堪比V3.5,非推理模型也有“啊哈时刻”

碰壁之后开始重新思考题目本身的含义,后面依旧陷入误区,但突然在中文解题过程中夹杂一句英语思考,类似DeepSeek-R1技术报告中的“啊哈时刻”

等等,这似乎与之前的对角线方法相似,也许我遗漏了什么。

DeepSeek V3小版本升级实测堪比V3.5,非推理模型也有“啊哈时刻”

顿悟之后,突然就走上了正确的道路,注意到了题目中没直接提到的隐藏条件。

DeepSeek V3小版本升级实测堪比V3.5,非推理模型也有“啊哈时刻”

虽然从计算过程看,还是没理解到问题的本质,但好歹得出了解决方案,还认识到了自己的误区。

DeepSeek V3小版本升级实测堪比V3.5,非推理模型也有“啊哈时刻”

依旧免费, 依旧开源

像这样的优秀模型依旧免费, 依旧开源,权重文件已火速上线HuggingFace,使用最宽松的MIT协议。

DeepSeek V3小版本升级实测堪比V3.5,非推理模型也有“啊哈时刻”

所有权重文件加起来占硬盘空间约688GB,与初代v3保持一致,说明依然是671B参数的MoE模型,目前没有更多技术细节,还需等待官方进一步发布公告。

目前在官网和官方APP(关闭深度思考即可)、HuggingFace等渠道都能体验到v3-0324。

DeepSeek V3小版本升级实测堪比V3.5,非推理模型也有“啊哈时刻”

也可以到大模型竞技场去与其他模型pk,不过投票结果还要等一段时间才能出来。

DeepSeek V3小版本升级实测堪比V3.5,非推理模型也有“啊哈时刻”

当然最让大家期待的还是,v3更新了,r2还会远吗?

DeepSeek V3小版本升级实测堪比V3.5,非推理模型也有“啊哈时刻”

官网试玩:

https://chat.deepseek.com/

HuggingFace:

https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/blob/main/README.md

参考链接:
[1]https://x.com/TheXeophon/status/1904225899957936314
[2]https://x.com/Yuchenj_UW/status/1904223627509465116
[3]https://x.com/risphereeditor/status/1904194061780590773

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 3 月
 12
3456789
10111213141516
17181920212223
24252627282930
31  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开 Jay 2026-01-08 20:18:...
训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享 衡宇 2026-01-08 20:...
「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2...
AI金矿上打盹的小红书,刚刚醒了一「点点」

AI金矿上打盹的小红书,刚刚醒了一「点点」

AI金矿上打盹的小红书,刚刚醒了一「点点」 鱼羊 2025-12-26 17:04:08 来源:量子位 一个积...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
海信CES发布全新一代RGB-Mini LED,全球首创玲珑4芯真彩背光

海信CES发布全新一代RGB-Mini LED,全球首创玲珑4芯真彩背光

海信CES发布全新一代RGB-Mini LED,全球首创玲珑4芯真彩背光 量子位的朋友们 2026-01-06...
英特尔CES奇袭老黄大本营!英伟达显卡刚涨价,最强酷睿量产出货

英特尔CES奇袭老黄大本营!英伟达显卡刚涨价,最强酷睿量产出货

英特尔CES奇袭老黄大本营!英伟达显卡刚涨价,最强酷睿量产出货 十三 2026-01-06 13:54:54 ...
陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能

陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能

陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能 鹭羽 2026-01-06 14:28:58 来...
OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex 衡宇 2026-01-06 13:0...