微信扫码
添加专属顾问
我要投稿
国产AI编程新星Doubao-Seed-Code横空出世,与Trae强强联手登顶编程榜单!核心内容:1. Doubao-Seed-Code在SWE-Bench等权威测试中超越Claude等主流模型2. 模型具备多模态理解能力,支持256K上下文和"深度思考"功能3. 提供按量计费和订阅套餐两种实惠的使用方案
今天被字节的新模型刷屏了,可以逐步摆脱 Claude 的封锁了,也让大家看到了国产模型的崛起,特别是 Coding 方面,今天字节跳动发布的 Doubao-Seed-Code 就是专门针对编程任务的模型。
与此同时 Trae 中国版也是第一时间宣布接入。
值得注意的是,模型 Doubao-Seed-Code 与工具 Trae 深度结合后,在 SWE-Bench Verified 榜单中达到了 78.80% 的成绩,超过了 TRAE 单独使用时的 75.2%,位居榜首。
我们先看看这个模型的实际表现。字节公布的数据显示,Doubao-Seed-Code 在几个权威测试中都有不错的成绩。
在 SWE-Bench-Verified 这个测试中,TRAE 配合 Doubao-Seed-Code 拿到了 78.8% 的分数。这个分数在排行榜上位列第一。
作为对比,其他主流模型在同一测试中的表现是:
在 Terminal Bench 测试中,Doubao-Seed-Code 拿到了 41.3% 的分数。在 Multi-SWE-Bench-Flash-Openhands 测试中,它拿到了 39.3% 的分数。
这些测试主要考察 AI 模型解决真实编程问题的能力。分数越高,说明模型解决问题的能力越强。
Doubao-Seed-Code 是一个多模态模型。它不仅能理解文字,还能理解图片和视频。
这个能力在编程场景中很有用。比如,你可以给它一张 UI 设计稿的截图,它能直接生成对应的代码。你也可以给它一张手绘草图,它能理解你的意图并生成代码。
模型支持 256K 的上下文长度。这意味着它可以处理非常大的代码文件。对于复杂的项目,这个能力很重要。
另外,这个模型还有"深度思考"功能。它在生成代码之前,会先思考问题的解决方案。这让它的输出更加准确。
字节为这个模型提供了两种使用方式。
第一种是按量计费。具体价格是:
这个价格相对来说比较实惠。特别是对于需要处理大量代码的场景,缓存功能可以节省不少成本。
第二种是订阅套餐。火山方舟推出了 Coding Plan,包含两个档位:
这些套餐不仅支持 Doubao-Seed-Code,还支持 Claude Code、Cursor、Cline 等主流 AI 编码工具。
Doubao-Seed-Code 兼容 Anthropic API。这意味着,如果你之前用的是 Claude,现在切换到 Doubao-Seed-Code 只需要改几行配置。
具体来说,你只需要修改三个环境变量:
https://ark.cn-beijing.volces.com/api/codingdoubao-seed-code-preview-latest改完这三个配置,你的应用就能使用 Doubao-Seed-Code 了。对于已经集成了 Claude 的项目,迁移成本非常低。
从功能特点看,Doubao-Seed-Code 特别适合以下几个场景:
处理大型代码库。它支持 256K 的上下文,可以一次性处理很大的代码文件。这对于复杂项目的重构和优化很有帮助。
从设计稿生成代码。它支持视觉理解,可以直接从 UI 设计稿、截图或草图生成代码。这能大大提高前端开发的效率。
修复样式和 Bug。你可以把有问题的页面截图发给它,它能理解问题并生成修复代码。
Agentic 编程任务。模型专门针对这类任务做了优化。如果你的工作涉及到自动化编程流程,这个模型会很合适。
虽然测试成绩不错,但实际使用效果还需要在真实项目中验证。毕竟,测试环境和实际工作场景还是有差别的。
目前,Doubao-Seed-Code 还处于预览版阶段(Model ID 包含 preview 字样)。正式版发布后,功能和性能可能还会有优化。
另外,模型有一些使用限制。比如,最大输入 Token 是 224K,最大输出 Token 是 32K。在使用时需要注意这些限制。
RPM(每分钟请求数)限制为 5000,TPM(每分钟 Token 数)限制为 120 万。对于大多数个人开发者来说,这个限制足够用了。但如果是企业级应用,可能需要考虑这些限制因素。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-11-11
OpenText CE 25.4 新功能:解锁安全可信的信息管理
2025-11-11
Sealos + Claude Code + K2-thinking 一把梭!
2025-11-11
用了一圈国产模型,发现Anthropic就是大善人
2025-11-11
OpenAI 将推出群聊功能,终于要对 Slack 下手了
2025-11-11
彻底爆了!一文了解LLM应用架构:从Prompt到Multi-Agent
2025-11-11
GEO实操手册——如何让AI引用你
2025-11-11
88%的公司在用AI,但只有39%吃到真金白银?麦肯锡2025 AI报告来了!
2025-11-11
万字复盘 Google 搜索如何一年实现 AI 翻盘,产品副总裁分享三大核心产品经验
2025-08-21
2025-08-21
2025-08-19
2025-09-16
2025-10-02
2025-09-08
2025-09-17
2025-09-19
2025-08-19
2025-09-29
2025-11-10
2025-11-09
2025-11-09
2025-11-08
2025-11-06
2025-11-06
2025-11-06
2025-11-05