我要投稿

字节杀疯了！刚刚发布AI编程模型，Trae率先接入登顶榜首

发布日期：2025-11-11 21:13:41 浏览次数： 5079

作者：AI智见录

微信搜一搜，关注“AI智见录”

今天被字节的新模型刷屏了，可以逐步摆脱 Claude 的封锁了，也让大家看到了国产模型的崛起，特别是 Coding 方面，今天字节跳动发布的 Doubao-Seed-Code 就是专门针对编程任务的模型。

与此同时 Trae 中国版也是第一时间宣布接入。

值得注意的是，模型 Doubao-Seed-Code 与工具 Trae 深度结合后，在 SWE-Bench Verified 榜单中达到了 78.80% 的成绩，超过了 TRAE 单独使用时的 75.2%，位居榜首。

编程任务表现如何

我们先看看这个模型的实际表现。字节公布的数据显示，Doubao-Seed-Code 在几个权威测试中都有不错的成绩。

在 SWE-Bench-Verified 这个测试中，TRAE 配合 Doubao-Seed-Code 拿到了 78.8% 的分数。这个分数在排行榜上位列第一。

作为对比，其他主流模型在同一测试中的表现是：

• TRAE 单独使用：75.2%
• Claude 4.5 Sonnet：77.2%
• DeepSeek-V3.1：68.2%
• Kimi-K2：68.3%
• GLM-4.6：68.2%

在 Terminal Bench 测试中，Doubao-Seed-Code 拿到了 41.3% 的分数。在 Multi-SWE-Bench-Flash-Openhands 测试中，它拿到了 39.3% 的分数。

这些测试主要考察 AI 模型解决真实编程问题的能力。分数越高，说明模型解决问题的能力越强。

这个模型有什么特点

Doubao-Seed-Code 是一个多模态模型。它不仅能理解文字，还能理解图片和视频。

这个能力在编程场景中很有用。比如，你可以给它一张 UI 设计稿的截图，它能直接生成对应的代码。你也可以给它一张手绘草图，它能理解你的意图并生成代码。

模型支持 256K 的上下文长度。这意味着它可以处理非常大的代码文件。对于复杂的项目，这个能力很重要。

另外，这个模型还有"深度思考"功能。它在生成代码之前，会先思考问题的解决方案。这让它的输出更加准确。

价格和使用方式

字节为这个模型提供了两种使用方式。

第一种是按量计费。具体价格是：

• 推理输入：1.2 元/百万 tokens
• 推理输出：8 元/百万 tokens
• 缓存命中：0.24 元/百万 tokens

这个价格相对来说比较实惠。特别是对于需要处理大量代码的场景，缓存功能可以节省不少成本。

第二种是订阅套餐。火山方舟推出了 Coding Plan，包含两个档位：

• Lite 套餐：首月 9.9 元，续费 40 元/月
• Pro 套餐：首月 49.9 元，续费 200 元/月

这些套餐不仅支持 Doubao-Seed-Code，还支持 Claude Code、Cursor、Cline 等主流 AI 编码工具。

技术接入很简单

Doubao-Seed-Code 兼容 Anthropic API。这意味着，如果你之前用的是 Claude，现在切换到 Doubao-Seed-Code 只需要改几行配置。

具体来说，你只需要修改三个环境变量：

• ANTHROPIC_BASE_URL：改为 https://ark.cn-beijing.volces.com/api/coding
• ANTHROPIC_AUTH_TOKEN：填入你的火山方舟 API Key
• ANTHROPIC_MODEL：改为 doubao-seed-code-preview-latest

改完这三个配置，你的应用就能使用 Doubao-Seed-Code 了。对于已经集成了 Claude 的项目，迁移成本非常低。

适合哪些场景

从功能特点看，Doubao-Seed-Code 特别适合以下几个场景：

处理大型代码库。它支持 256K 的上下文，可以一次性处理很大的代码文件。这对于复杂项目的重构和优化很有帮助。

从设计稿生成代码。它支持视觉理解，可以直接从 UI 设计稿、截图或草图生成代码。这能大大提高前端开发的效率。

修复样式和 Bug。你可以把有问题的页面截图发给它，它能理解问题并生成修复代码。

Agentic 编程任务。模型专门针对这类任务做了优化。如果你的工作涉及到自动化编程流程，这个模型会很合适。

值得注意的地方

虽然测试成绩不错，但实际使用效果还需要在真实项目中验证。毕竟，测试环境和实际工作场景还是有差别的。

目前，Doubao-Seed-Code 还处于预览版阶段（Model ID 包含 preview 字样）。正式版发布后，功能和性能可能还会有优化。

另外，模型有一些使用限制。比如，最大输入 Token 是 224K，最大输出 Token 是 32K。在使用时需要注意这些限制。

RPM（每分钟请求数）限制为 5000，TPM（每分钟 Token 数）限制为 120 万。对于大多数个人开发者来说，这个限制足够用了。但如果是企业级应用，可能需要考虑这些限制因素。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-28

字节跳动最新AI Coding实践曝光，我总结了7 条反常识的结论

2026-06-28

企业级AI的核心不是Agent，而是让Agent变得不重要的Skills

2026-06-27

OpenAI深夜引爆GPT-5.6，三箭齐发全面围剿Anthropic

2026-06-27

Agent 发邮件踩坑全记录：从 SMTP 翻车到 Agently Mail

2026-06-27

AgentTeams 和 Claude Tag 都进入群聊模式，是新范式还是新叙事？

2026-06-27

GPT-5.6 Sol深夜炸场发布！OpenAI最强模型碾压Claude 5！

2026-06-26

腾讯混元AI Infra如何优化Hy3 Preview：一次大模型推理性能提升的技术拆解

2026-06-26

多智能体的记忆接线：同一任务，每个角色看到的不一样

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Claude Opus 4.7刚刚曝光！Claude Code一夜重构，7x24小时替你打工

2026-04-15

OpenAI Codex CLI 完整使用指南

2026-04-07

Claude Code 和 Codex 接入 Figma MCP 保姆级教程

2026-04-07

刚刚Qwen 3.6 Plus上线预览：1M上下文，阿里Coding/Agent翻身战打响

2026-03-31

GPT5.5来了，最大特点解析

2026-04-24

Claude Opus 4.7 发布，全网最详细解读

2026-04-17

突发！Claude Code 源码泄露，扒出这些隐藏功能

2026-03-31

GPT-6，曝光了

2026-04-05

GLM-5.1 实测：面向 Agent 长程任务的国内第一模型

2026-04-02

重磅！GPT-6曝光了

2026-04-05

大家都在问

AgentTeams 和 Claude Tag 都进入群聊模式，是新范式还是新叙事？

2026-06-27

Agent 从 Demo 到生产级，中间到底差什么？

2026-06-26

微信在金矿上孵化了啥？

2026-06-25

企业智能体的下半场，如何让智能体越用越聪明？

2026-06-18

Agent 记忆，我们全都理解错了？

2026-06-18

如何利用 Harness “一句话交付产品功能”？

2026-06-10

Loop Engineering 循环工程又是什么鬼？

2026-06-10

Agent 工程化五件套：Prompt、Skill、MCP、CLI 到底怎么配合？

2026-06-07

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw