我要投稿

重磅！开发者利好，编码王者Claude 4来了！

发布日期：2025-05-23 05:27:07 浏览次数： 2756

作者：GeekSavvy

微信搜一搜，关注“GeekSavvy”

就在刚刚，Anthropic举办了他们头一回的开发者大会“Code with Claude”。公司首席产品官Mike Krieger（就是之前搞Instagram的）和CEO兼联合创始人Dario Amodei都出来站台了。

Krieger开场就说，Anthropic的目标是做出又强、又能帮忙、还靠谱的AI系统，而且要让开发者用上这些好东西，去改进工作方法、甚至是开公司的方式。重点是增强人的创造力，而不是取代人。

这次发布会，Anthropic推出新一代Claude 4系列模型，包括Claude 4 Opus和Claude 4 Sonnet，这些模型在发布当天即可在所有相关产品上使用。

01 Claude 4 Opus

被定位为系列中能力最强、最智能的模型

Claude 4 Opus特别适用于编码和处理复杂的智能体（Agentic）任务。该模型在一些行业标准测试（如Sweep Bench）中表现顶尖，并能自主完成以往需要人类六至七小时才能完成的工作。Amodei提及，他曾被Opus生成的内部纪要的逼真度所迷惑，误以为是团队成员所写。

02 Claude 4 Sonnet

一款在智能与效率之间取得平衡的中端模型

Claude 4 Sonnet是Sonnet 3.7的直接升级版，在保持同等成本的同时提供了更强的智能。新版本还针对Sonnet 3.7中存在的“过度热心”（执行超出要求的任务）等反馈进行了改进。

这两款Claude 4模型均为“混合模型”，支持快速响应和用于深度推理的扩展思考两种模式。它们已在Claude自家产品、Claude Code工具、Anthropic API、Amazon Bedrock及Google Cloud Vertex AI等平台上线。

03 AI Agent

Anthropic认为AI智能体正在改变工作与创新方式。新的Claude 4模型为此带来了多项关键新功能：

工具使用与并行处理：模型在推理过程中能够使用如网页搜索等工具，并能并行处理多个工具。
跨会话记忆：在获得本地文件访问权限后，模型可以跨会话保持记忆并逐步积累知识。
长时任务执行能力：相较于Claude 3的分钟级自主工作能力和Claude 3.7的约45分钟自主工作能力，Claude 4能实现长达数小时的自主任务处理，有客户报告称其可持续工作7小时。

同时，首席产品官Mike Krieger指出，优秀的AI智能体应具备三大核心能力：

1. 情境智能 (Contextual Intelligence)：理解用户和组织的独特情境，并从经验中持续学习。他强调，与智能体交互的第100个任务应远胜于第一个任务。

2. 长时执行 (Long-running Execution)：无需持续管理即可处理复杂的多小时任务，并按需与其他智能体和人类协调。

3. 真诚协作 (Genuine Collaboration)：进行有意义的对话，适应用户工作风格，并为其行为提供透明的推理。

04 开发者工具与API升级

Anthropic为开发者推出了一系列新的API功能和工具更新：

代码执行工具 (Code Execution Tool)：该工具已在Anthropic API上线，它使Claude能够运行代码，扮演数据分析师的角色，将原始数据转化为可视化洞察。
Claude Code 正式版与拓展：这款最初由Anthropic内部技术负责人Boris发起的AI编程工具现已进入正式访问阶段。据称，该工具已将Anthropic内部工程师的技术上手时间从两三周缩短至两三天。
IDE集成：支持VS Code和JetBrains等常用编辑器，代码改动可直接在编辑器内联查看。
Claude Code SDK：提供了一个开发工具包，允许开发者将Claude Code的功能集成到自己的应用和工作流程中。例如，Anthropic演示了如何在GitHub上通过标签（@Claude）让Claude Code响应代码审查（PR）反馈、修改代码或实现测试覆盖等功能。