微信扫码
添加专属顾问
我要投稿
Anthropic开发者大会发布新一代AI编码助手Claude 4,旨在提升开发者创造力。核心内容:1. Anthropic发布Claude 4系列模型,包括Opus和Sonnet两款2. Claude 4在编码和智能体任务中表现出色,能大幅提高工作效率3. 新模型支持混合模式,已在多个平台上线,具备三大核心AI能力
就在刚刚,Anthropic举办了他们头一回的开发者大会“Code with Claude”。公司首席产品官Mike Krieger(就是之前搞Instagram的)和CEO兼联合创始人Dario Amodei都出来站台了。
Krieger开场就说,Anthropic的目标是做出又强、又能帮忙、还靠谱的AI系统,而且要让开发者用上这些好东西,去改进工作方法、甚至是开公司的方式。重点是增强人的创造力,而不是取代人。
这次发布会,Anthropic推出新一代Claude 4系列模型,包括Claude 4 Opus和Claude 4 Sonnet,这些模型在发布当天即可在所有相关产品上使用。
01 Claude 4 Opus
被定位为系列中能力最强、最智能的模型
Claude 4 Opus特别适用于编码和处理复杂的智能体(Agentic)任务。该模型在一些行业标准测试(如Sweep Bench)中表现顶尖,并能自主完成以往需要人类六至七小时才能完成的工作。Amodei提及,他曾被Opus生成的内部纪要的逼真度所迷惑,误以为是团队成员所写。
02 Claude 4 Sonnet
一款在智能与效率之间取得平衡的中端模型
Claude 4 Sonnet是Sonnet 3.7的直接升级版,在保持同等成本的同时提供了更强的智能。新版本还针对Sonnet 3.7中存在的“过度热心”(执行超出要求的任务)等反馈进行了改进。
这两款Claude 4模型均为“混合模型”,支持快速响应和用于深度推理的扩展思考两种模式。它们已在Claude自家产品、Claude Code工具、Anthropic API、Amazon Bedrock及Google Cloud Vertex AI等平台上线。
03 AI Agent
Anthropic认为AI智能体正在改变工作与创新方式。新的Claude 4模型为此带来了多项关键新功能:
工具使用与并行处理:模型在推理过程中能够使用如网页搜索等工具,并能并行处理多个工具。
跨会话记忆:在获得本地文件访问权限后,模型可以跨会话保持记忆并逐步积累知识。
长时任务执行能力:相较于Claude 3的分钟级自主工作能力和Claude 3.7的约45分钟自主工作能力,Claude 4能实现长达数小时的自主任务处理,有客户报告称其可持续工作7小时。
同时,首席产品官Mike Krieger指出,优秀的AI智能体应具备三大核心能力:
1. 情境智能 (Contextual Intelligence):理解用户和组织的独特情境,并从经验中持续学习。他强调,与智能体交互的第100个任务应远胜于第一个任务。
2. 长时执行 (Long-running Execution):无需持续管理即可处理复杂的多小时任务,并按需与其他智能体和人类协调。
3. 真诚协作 (Genuine Collaboration):进行有意义的对话,适应用户工作风格,并为其行为提供透明的推理。
04 开发者工具与API升级
Anthropic为开发者推出了一系列新的API功能和工具更新:
代码执行工具 (Code Execution Tool):该工具已在Anthropic API上线,它使Claude能够运行代码,扮演数据分析师的角色,将原始数据转化为可视化洞察。
Claude Code 正式版与拓展:这款最初由Anthropic内部技术负责人Boris发起的AI编程工具现已进入正式访问阶段。据称,该工具已将Anthropic内部工程师的技术上手时间从两三周缩短至两三天。
IDE集成:支持VS Code和JetBrains等常用编辑器,代码改动可直接在编辑器内联查看。
Claude Code SDK:提供了一个开发工具包,允许开发者将Claude Code的功能集成到自己的应用和工作流程中。例如,Anthropic演示了如何在GitHub上通过标签(@Claude)让Claude Code响应代码审查(PR)反馈、修改代码或实现测试覆盖等功能。
发布会上演示了使用Claude Code为开源白板工具Excalidraw添加表格组件,据称Claude Code自主工作90分钟完成了该任务。
API平台升级:
1. 文件API (Files API):即日起在API中可用,方便开发者访问和存储文档,并提供cookbook帮助开发者在其应用中构建记忆功能。
2. 模型上下文协议 ( MCP):现在可以通过API直接连接。该协议已被微软、谷歌、OpenAI等公司采用,社区已构建超过3000个集成。
3. 网页搜索 (Web Search):为Claude提供实时信息访问能力。
4. 提示词缓存 (Prompt Caching) 升级:缓存的存活时间(TTL)从5分钟延长至1小时。对于长提示词任务,这可降低高达90%的成本和85%的延迟。据称,平台上超过50%的输入token已被缓存。
05 与GitHub合作深化
1. GitHub Copilot现已支持Claude Sonnet 4和Opus 4,并已上线。
2. GitHub内部的编码智能体(provider coding agent)由Claude Sonnet驱动,选择原因是其强大的编码知识、问题解决能力、指令遵循能力以及Anthropic API的缓存支持。
3. GitHub正在正式采用并推广MCP协议。
4. Claude Code及其SDK将被集成到GitHub的智能体平台中。
Last but not least
Anthropic这次“Code with Claude”大会,干货确实不少。尤其Coding,对开发者是利好的。
同时,不光是发了新模型,更重要的是亮出了他们想怎么帮开发者用好AI智能体的一套打法。
他们强调AI智能体要能长时间干活、能理解具体情况、能跟人好好协作,还一直抓着安全和可解释性不放,这说明他们是真想把AI做成能派上大用场的“合作者”。
这不仅是在构建工具,更是在塑造一种全新的、更智能的生产关系,预示着一个开发者与AI共创未来的新起点来了。
2025,Agent!
关注公众号,用极客视角洞察未来!
往期精彩文章推荐:
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-08-13
2024-06-13
2024-08-21
2024-09-23
2024-07-31
2024-05-28
2024-08-04
2024-04-26
2024-07-09
2024-09-17
2025-05-23
2025-05-18
2025-05-18
2025-05-17
2025-05-13
2025-05-13
2025-05-12
2025-05-11