网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一

478次阅读
没有评论

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一

生成的网站能直接一键运行

编程王者Claude地位不稳了??

大模型竞技场最新战报出炉,DeepSeek新版R1拿下网页编程第一,小胜Claude Opus 4

要知道Claude Opus 4可是公认的“全球最强编码模型”。

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一

so,能在编程上战胜Claude Opus 4,DeepSeek-R1-0528到底啥来头?

看名字你可能以为是个小版本更新,但实际上——

它在LiveCodeBench上几乎与OpenAI o3-high相当,乃至一众网友猜测其为传说中的R2。

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一

这样一看,在编程这一项上,双方貌似都不太好惹~

所以话不多说,咱们还是一手实测DeepSeek-R1-0528,康康究竟有多强。

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一

实测一下

目前DeepSeek-R1-0528已上线DeepSeek官方网站、App和小程序(打开深度思考)。

这里咱们直接进入官网体验。

测试1:制作一个太阳系的动画应用程序

提示词如下:

制作一个太阳系的动画应用程序,使用网络搜索。

仅思考49秒后,DeepSeek-R1-0528就给出了一段python代码。

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一

用VS Code运行后,结果如下:

出现了能自主运行的动画,不过页面相对粗糙。

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一

不过呢,如果换成其他提示词,效果则明显不一样了。

用Three.js模拟太阳系,鼠标悬停在星球上时显示星球名称。

仅用时34秒,DeepSeek-R1-0528就理清楚了设计思路:

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一

关键是这一次能直接一键运行了,无需再单独打开自己的编辑器。(运行功能感觉像开盲盒,不一定都会出现)

而且同样有动画、能交互,效果直接进入Next Nevel~

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一

测试2:前端网页制作

接下来我们要求DeepSeek生成一个主题为AGI的网站,提示词如下:

请设计一个以通用人工智能(AGI)为主题的网页,包含“知识共享”、“社区”和“未来创造”三个概念部分。每个部分应配有相应的图标和简洁描述,整体风格现代且科技感十足,突出AGI的创新和协作精神。使用HTML、CSS和JavaScript实现交互和视觉特效。

思考23秒后,DeepSeek-R1-0528后续给出了一段HTML代码,依旧能一键运行。

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一

测试3:创建一个俄罗斯方块小游戏

最后我们试试英文提示词:

Create a full featured version of tetris with beautiful graphics and controls.
创建一个具有精美图形和控制功能的完整版俄罗斯方块。

可以看到,DeepSeek-R1-0528思考12秒后就给出了一段python代码。

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一

运行结果be like:

虽然确实是俄罗斯方块小游戏,但基本演示存在明显bug,而且缺少交互按钮。

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一

不死心的我们尝试让DeepSeek继续改进,结果第二次还是翻车了。

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一

改进后的游戏依旧无法正常运行(总是穿墙而过),且未实现我们明确要求的交互功能。

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一

小结一下,从以上简单实测来看,DeepSeek新版R1作为一款开源模型,在编程能力上确实大有进步,但仍有一定提升空间。

不过有一说一,它对咱们国内普通用户明显更友好(相对Claude模型来说免费又易于获取)

One More Thing

除了编程能力榜单更新,DeepSeek新版R1还当选了当前最好的开源文本模型

MIT许可证下,总榜第六,开源当中第一。

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一

而在细分领域,它在困难提示方面排名第4,在数学方面排名第5,属于开源模型中相当能打的玩家。

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一

不过值得一提的是,Kimi新模型刚刚拿下代码开源SOTA——

参数量仅72B的开源代码模型Kimi-Dev,在SWE-bench Verified上以60.4%的成绩取得开源SOTA。

不仅编程水平比最新的DeepSeek-R1还强,和闭源模型比较也表现优异。

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一

不知道其真实能力又如何呢(doge)~

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 6 月
 1
2345678
9101112131415
16171819202122
23242526272829
30  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
共推空天领域智能化升级!趋境科技与金航数码强强联手

共推空天领域智能化升级!趋境科技与金航数码强强联手

共推空天领域智能化升级!趋境科技与金航数码强强联手 十三 2025-12-09 18:18:41 来源:量子位...
起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机” 西风 202...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东

小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东

小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东 Jay 2025-12-09 08:26:01 来源...
梁文锋,Nature全球年度十大科学人物!

梁文锋,Nature全球年度十大科学人物!

梁文锋,Nature全球年度十大科学人物! 一水 2025-12-09 09:46:23 来源:量子位 来自安...
起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机” 西风 202...
摩尔线程新一代GPU架构10天后发布

摩尔线程新一代GPU架构10天后发布

摩尔线程新一代GPU架构10天后发布 思邈 2025-12-09 15:46:09 来源:量子位 国内首个聚焦...
极客公园创新大会 2026在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」

极客公园创新大会 2026在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」

极客公园创新大会 2026在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」 henry 2...