10000个代码文件,我打几把游戏的功夫就搞成Wiki了!
实测新升级的Qoder
金磊 发自 凹非寺
量子位 | 公众号 QbitAI
天下程序员苦看懂老、大项目久矣。
例如猛地给你一个包含近10000个代码文件的项目,你就说把它们给吃透得花多长时间吧。

But!现在你不用再为此发愁了,因为有一款国产AI编程工具,会给你来一波实实在在的神助攻!
多说无益,我们直接拿微软在GitHub上面的terminal仓库来打个样:

Terminal仓库包含了大约7500个文件,编程语言涵盖C++++、C#、JSON、XML、Markdown等。
接下来,我们先克隆一下:
git clone —depth=1
https://github.com/microsoft/terminal.git
然后把这个项目导进国产AI编程工具里面,先点击仓库Wiki(Repo Wiki)功能,再点击生成即可:

这期间我们什么额外的操作都不需要做,甚至你可以去打几把王者荣耀……回头再看,它已经生成出了
完整的Wiki!

可以看到,AI已经详尽地整理出整个代码工程系统,还是以图文并茂的方式把架构等细节内容给呈现了出来。
(注:生成时间长短取决于项目的大小。)
而且啊,这个Wiki还支持共享模式,团队里一个人生成,N个人可共享、协作。
如此一来,不论是梳理再庞大的项目,或是接手别人的陌生代码(甚至是没有注释的那种),一切都会变得从从容容、游刃有余~
那这到底是何许AI编程工具是也?
不卖关子,它正是今年8月份一问世便已然名声大噪过的Qoder。

而时隔仅三个月,这一次,它已然在AI编程圈里解锁了三个“最”:
- 最强模型:使用“全球顶级模型+专项自研模型”的方式,效果优势立竿见影,效果评分领先头部产品13.22%;
- 最全覆盖:全面支持IDE、CLI和JetBrains插件三种产品形态,无论你是小白还是专业开发者,都能用得上,一套账号和积分体系,体验丝滑一致;
- 最高性价比:在同样付费金额、SOTA模型的条件下,可完成205%的任务,性价比直接拉满。
从这三个“最”中不难看出,Qoder这次是要铆足了劲直击AI编程的七寸——主打一个为真实软件研发而生。
对真实软件最好的理解来自Qoder 创始人叔同,他提到:
Qoder 绕过从0到1生成新项目的“酷炫”场景,直接切入占开发者95%工作时间的“真实软件”研发领域。
真实软件是指真正产生商业价值的软件。一旦产生商业价值,就要对用户和客户负责,需要严肃的修改、迭代和演进,不能有故障问题,并且会有很多历史积累,可能存在5年、10年。
这些历史代码不能乱改,不能发挥想象或产生幻觉。因此这是价值高地,因为它真正支撑信息产业持续产生价值。
今天很多工具从Vibe Coding切入,而Qoder选择从真实软件切入,构建产品,这个选择足够大胆也很坚决。
但有一说一,毕竟真实开发场景可谓是错综复杂,即便是此前公认实力强悍如Cursor等产品,也时有被诟病。
Qoder到底能胜任到什么程度,唯有一波深度实测方能见分晓。
实测Qoder:后端程序员有福了
接下来,我们将用一个典型的企业级Java项目来贯穿整个实测内容。
有请被测“选手”——Spring Petclinic。
虽然Spring Petclinic整体的大小不大,但它是Spring官方最佳实践模板,涵盖了MVC、JPA、Thymeleaf、单元测试、数据库迁移、异常处理等企业开发核心要素。
我们依旧是先对这个项目做一下克隆的操作:
git clone
https://github.com/spring-projects/spring-petclinic.git
实测第一弹:IDE形态
精准理解代码工程的上下文,可以说是检验AI编程工具是否好用的关键指标之一。
为了实测这一点,我们先在Qoder IDE里面打开Spring Petclinic项目,再任意打开一个Java文件(例如OwnerController.java)。
然后我们在右下角的对话框中,选择“智能问答”模式,用自然语言提问:
这个controller的findAll方法用到了哪些Service和Repository?

从结果上来看,Qoder自动检索出了OwnerService → OwnerRepository的调用链,不仅给出了结论是“仅使用了OwnerRepository”,还将具体分析过程罗列的清清楚楚。
而这也只是Qoder对代码工程理解能力的冰山一角。
据了解,Qoder可一次检索10万个代码文件,类似电商网站前后端开发这样的任务,可以从数天压缩到约十分钟!
值得一提的是,Qoder这次还上线了模型分级选择器,包括基础轻量(Lite)、经济高效(Efficient)、极致性能(Performance)和智能路由(Auto)四种模式,可以匹配不同复杂度的研发。

理解和拿捏代码工程的全貌固然重要,但对于一个AI编程工具来说,执行力,才是关键中的关键。
Qoder所提供的Quest Mode正是一个由Spec驱动的AI自主编程功能。
在这个模式之下,开发者只需要用自然语言输入Spec(需求描述)即可,例如:
为Petclinic添加一个RESTful API:GET /api/vets/specialties,返回所有Petclinic列表,使用JPA和Spring Data REST,包含单元测试。

只需片刻功夫,Quest Mode就会基于这句简单的需求描述,先是设计出一份超完整的需求文档,然后自动并逐步执行计划中的任务,最后还会对整体的任务做一份总结:

由此一来,AI编程工具不再是实时伴随的存在,Qoder已经把它进化到了异步委派的程度。

实测第二弹:JetBrains插件
对于很多开发者来说(尤其是后端),JetBrains已然是用得非常习惯的一款IDE。
如果在看完刚才的实测后,你想在不换IDE的情况下使用Qoder的各类功能,现在也是可以的——插件形态,了解一下。

刚低调上线一周就斩获了3万多下载,后端开发者对JetBrains插件渴望已久啊!
安装完毕后,在JetBrains后侧的边栏中我们就能看到Qoder插件的身影。
我们依旧是小试牛刀地来看看插件形态下的Qoder对于整体项目框架的理解能力:
如何为 /owners/{ownerId} 添加分页?

可以看到,Qoder插件依旧是详细且稳稳地给出了问题的解决方案。
除此之外,Debugger集成也是Qoder插件在JetBrains中的一大亮点。
我们先在findowner这个方法处设置一个断点:

而后我们可以点击Debug按钮,JetBrains会自动暂停在咱们设置的断点处,此时再打开Qoder插件并询问:
ownerRepository.findById返回的是什么对象?

可以观察到Qoder插件能理解Debugger上下文,直接引用内存中的变量和调用链,无需开发者手动复制粘贴信息,实现智能调试建议。
除了Debbuger集成,数据库支持也是可以有的。
例如我们打开OwnerRepository.java,并询问:“这个findByLastName方法有SQL注入风险吗?”
嗯,依旧是稳稳输出。
划个重点:Qoder集成了海外SOTA模型,无论是速度还是体验都是一流水平;而且它还是唯一支持记忆感知的JetBrains插件。
这就意味着Qoder插件在与开发者的持续对话中,会自动形成针对个人编码习惯、项目特点、常见问题的记忆。
如此一来,就真正达到了“越用越懂你”的效果。
实测第三弹:CLI形态
除了IDE和插件之外,许多专业开发者们疯狂迷恋的命令行界面工具(CLI),Qoder也是支持的!
安装也非常的简单,只需要在终端里面输入一行代码即可:
curl -fsSL
https://qoder.com/install
| bash
安装成功后,重启终端并输入qodercli就可以开搞了:
我们先来在Vet.java文件中制造一个典型的bug,即一个潜在的空指针风险:
而后我们直接在CLI里面,用自然语言的方式让Qoder来修复一下这个bug:
Vet.java文件中有个bug,帮我找到并修复一下。
非常精准,Qoder CLI直接找到到了bug所在之处,并且已经帮我们修复好了!
通过@qoder还可直接在Issues和Pull Requests中进行交互对话:需要解释某段复杂逻辑时,评论@qoder解释这段代码;发现bug需要修复时,直接评论@qoder修复这个问题。
而且Qoder CLI可以与GitHub深度集成,可在几分钟内提供有关拉取请求的上下文反馈,进行高质量代码审查。只需在仓库的 .github/workflows/ 目录添加配置文件,就能为每个Pull Request自动提供智能代码审查。
据了解,它可以提升2倍代码审查质量,提升10倍审查效率,大幅降低了人工审查代码的压力。
Qoder CLI之所以能够做到又快又准,是因为它内置一个轻量的Agent,支持自定义插件、命令及子代理的扩展。
从评测结果上来,Qoder CLI已经是Claude Code的完美平替了。
最后总结来看本次的实测结果,我们不难发现,Qoder能够同时支持IDE、JetBrains插件和CLI三种形态,只是它亮点中的一隅。
更难得是它在技术上实现了业界领先的增强上下文工程(评测领先13.22%)、拥有记忆力感知(对话质量提升40%)、全球顶尖模型加持(RepoWiki模型Credits消耗节省93%)。
最最最重要的一点,是很多开发者更加关心的的性价比——花同样的钱,可以完成205%的编程任务。
如果Qoder Pro按照实付$10实际2000 Credits计价,$20对应4000 Credits,SOTA模型可运行任务数为204.5,耐用度比Cursor高104.9%。
嗯,最强模型、最全覆盖和最高性价比,Qoder这次是真的做到了。另外,大家关心的团队版本据说将在12月初上线,再次把期待值拉满了。
AI编程耐不耐用,现在也有标准了
不过一个AI编程工具到底好不好,光谈实测和体验还是不够的。
这一次,Qoder团队为行业提供了一个可参考的标准——AI编程工具的耐用度评测集,还开源了!
从语言方面来看,这个产品耐用度评测集涵盖了目前最主流、最常用的几种,比如 Python、JavaScript、TypeScript、Java 和 Golang等。
而且还会针对每种语言,设置一些使用主流或较新技术框架的题目。这就像模拟了开发者们在实际项目中会遇到的真实环境和复杂场景,能更全面地考察AI编程工具在复杂情况下的表现。
据了解,Qoder已经通过真实软件项目做了相应的测评,从结果来看,对比头部AI IDE产品,Qoder在复杂工程、生成效果、Credits耐用度方面,均已经超过全球头部产品。
并且团队还计划在明年3月份前把评测集中的真实开发场景案例数量扩展到50多个。
不得不说,以后再要评判哪家的AI编程工具好,各式各样只能看到数字成绩的Benchmark可以往后稍一稍了;效果好不好,真实开发场景的实测说了算。
最后,体验地址放下面了,感兴趣的小伙伴们可以冲了~
Qoder地址:
https://qoder.com/
耐用度评测集地址:
https://github.com/agentic-coding-durability-evalset