我要投稿

Claude Sonnet 4.5 发布：全解析

发布日期：2025-09-30 07:07:42 浏览次数： 2764

作者：赛博禅心

微信搜一搜，关注“赛博禅心”

Claude Sonnet 4.5

Claude Sonnet 4.5 现已全球发布，定价为：3美元/百万 token 输入，15美元/百万 token 输出，与Claude Sonnet 4的价格相同。通过提示缓存可节省高达90%的成本，批量处理可节省50%的成本。

用户可通过 Claude.ai 网站、iOS 和 Android 应用与 Sonnet 4.5 进行对话。

对于希望构建智能体的开发者，Sonnet 4.5已集成到 Claude 开发者平台、Amazon Bedrock 和 Google Cloud 的 Vertex AI中。

核心升级

在 Claude Code 中，Anthropic添加了最受欢迎的功能之一的检查点功能，可保存进度并即时回滚到之前的状态。还更新了终端界面并发布了原生 VS Code 扩展。

在 Claude API 中，Anthropic新增了上下文编辑功能和记忆工具，让智能体能够运行更长时间并处理更复杂的任务。

在 Claude 应用中，代码执行和文件创建（电子表格、幻灯片和文档）功能已直接集成到对话中。

Anthropic 还为上个月加入等待列表的Max用户提供了 Claude for Chrome 扩展程序。

性能评测

Claude Sonnet 4.5在SWE-bench Verified评测中表现卓越

Claude Sonnet 4.5 在衡量实际软件编程能力的 SWE-bench Verified 评测中达到了业界领先水平。

实际应用中，Anthropic 观察到它能够保持超过30小时的专注度来处理复杂的多步骤任务。

在测试AI模型实际计算机任务能力的 OSWorld 基准测试中，Sonnet 4.5 以 61.4%的得分领先。

就在四个月前，Sonnet 4 还以 42.2% 的得分领先。Claude for Chrome 扩展程序充分利用了这些升级能力。

Claude for Chrome brings AI where you're already working

模型在推理和数学等广泛评测中表现提升

该模型还在包括推理和数学在内的广泛评测中表现出改进的能力。

金融、法律、医学和STEM领域的专家发现，与旧模型（包括Opus 4.1）相比，Sonnet 4.5在领域特定知识和推理方面表现出显著更好的能力。

金融领域

法律领域

医学领域

STEM领域

安全性与对齐性

Claude Sonnet 4.5不仅是 Anthropic 能力最强的模型，也是迄今为止对齐性最好的前沿模型。Claude 改进的能力和 Anthropic 广泛的安全训练使得 Anthropic 能够大幅改进模型的行为，减少了谄媚、欺骗、权力寻求以及鼓励妄想思维等令人担忧的行为。

对于模型的智能体和计算机使用能力，Anthropic 还在防御提示注入攻击（这些能力用户面临的最严重风险之一）方面取得了重大进展。

来自自动化行为审计器的总体未对齐行为评分（越低越好）

未对齐行为包括（但不限于）欺骗、谄媚、权力寻求、鼓励妄想以及对有害系统提示的遵守。更多详细信息可以在Claude Sonnet 4.5系统卡中找到。

Claude Sonnet 4.5根据Anthropic的框架在Anthropic的AI安全级别3（ASL-3）保护下发布，该框架将模型能力与适当的保障措施相匹配。这些保障措施包括称为分类器的过滤器，旨在检测潜在危险的输入和输出——特别是与化学、生物、放射和核（CBRN）武器相关的输入和输出。

Claude Agent SDK

Anthropic 花费了六个多月的时间为 Claude Code 发布更新，因此 Anthropic 知道构建和设计 AI 智能体需要什么。

Anthropic 解决了难题：智能体应该如何在长时间运行的任务中管理内存，如何处理平衡自主性与用户控制的权限系统，以及如何协调为实现共同目标而工作的子智能体。

Building agents with the Claude Agent SDK

现在，Anthropic 将所有这些功能提供给用户。

Claude Agent SDK与驱动Claude Code的基础设施相同，但它对非常广泛的任务都显示出令人印象深刻的益处，不仅仅是编程。

Anthropic 构建 Claude Code 是因为 Anthropic 想要的工具还不存在。Agent SDK为您提供了相同的基础，可以为您正在解决的任何问题构建同样强大的东西。

"Imagine with Claude"研究预览

Anthropic 正在发布一个临时研究预览，与 Claude Sonnet 4.5 一起发布，名为"Imagine with Claude"。

An experimental new way to design software

在这个实验中，Claude 即时生成软件。没有功能是预先确定的；没有代码是预先编写的。您看到的是 Claude 实时创建，在您交互时响应和适应您的请求。

这是一个有趣的演示，展示了 Claude Sonnet 4.5 能做什么——一种当您将有能力的模型与正确的基础设施相结合时可以看到可能性的方式。

"Imagine with Claude" 在未来五天内对Max订阅用户开放。Anthropic鼓励您在claude.ai/imagine上尝试它。

使用建议

Anthropic 建议所有用途都升级到 Claude Sonnet 4.5。

无论您是通过Anthropic的应用程序、Anthropic的API还是Claude Code使用Claude，Sonnet 4.5都是一个即插即用的替代品，以相同的价格提供大幅改进的性能。

Claude Code更新对所有用户可用。Claude开发者平台更新，包括Claude Agent SDK，对所有开发者可用。代码执行和文件创建在Claude应用程序的所有付费计划中可用

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-05-29

软件架构演化简史：从单体到AI原生

2026-05-29

李开复王小川转身，大模型创业上半场结束

2026-05-29

如何把 Codex 用到极致

2026-05-29

全球Harness驾驭工程发展态势、模式演进与落地挑战分析

2026-05-29

刚刚，Claude Opus 4.8 正式发布！

2026-05-28

谷歌放弃 Gemini CLI，转头用 Go 写了个新玩具 Antigravity CLI

2026-05-28

Claude code云端部署 & 魔改sdk实现http流式调用保姆级教程

2026-05-28

“不用AI的CEO，我会亲自干掉他！”亿万富翁马克·库班最新对话：看好Claude，但奥特曼迟早被自己反噬

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Claude Opus 4.7刚刚曝光！Claude Code一夜重构，7x24小时替你打工

2026-04-15

OpenAI Codex CLI 完整使用指南

2026-04-07

刚刚Qwen 3.6 Plus上线预览：1M上下文，阿里Coding/Agent翻身战打响

2026-03-31

2026年国内如何注册 Claude 账号教程

2026-03-13

Claude Code 和 Codex 接入 Figma MCP 保姆级教程

2026-04-07

独家| DeepSeek-V4终于要来了：梁文锋憋半年大招，多模态+长期记忆全面破局

2026-03-17

香港终于能直接用 Gemini 了，内地用户能用上吗？

2026-03-17

编程选GPT-5.4，还是GPT-5.3-Codex？

2026-03-21

GPT5.5来了，最大特点解析

2026-04-24

刚刚，GPT-5.4 发布，百万上下文、最强全能模型

2026-03-06

大家都在问

如何使用Codex的Goals机制完成长程任务？

2026-05-26

Codex 的 computer use 功能，为什么这么好用？

2026-05-23

前有用友YonClaw，今有金蝶灵基，中国软件双雄的AI底牌谁能笑到最后？

2026-05-21

Harness Engineering：AI 能在真正"出事会炸"的后端系统里写代码吗？

2026-05-19

谁来给企业端即将大规模入职的Agent盖办公室？

2026-05-09

鹅厂员工觉得好的code模型应该具备什么能力？

2026-05-09

Markdown要被抛弃了？Claude Code工程师自曝：我已彻底放弃使用Markdown！团队倾向使用HTML！网友：其他编辑工具会被淘汰吗？

2026-05-09

AI吞噬软件的叙事要分化了？

2026-05-08

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw