我要投稿

刚刚，Claude 4.1 发布

发布日期：2025-08-06 07:44:47 浏览次数： 2200

作者：AGI Hunt

微信搜一搜，关注“AGI Hunt”

Claude Opus 4.1 来了，而且未来几周还有更大的升级！

刚刚，Anthropic 发布了 Claude Opus 4.1，这是对 Claude Opus 4 在智能体任务、真实世界编码和推理能力上的全面升级。

而更让人期待的是，Anthropic 明确表示：

未来几周内将发布对模型的实质性重大改进。

这次升级已经对付费用户开放，同时也可以通过 API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 使用。

价格保持不变，与 Opus 4 相同。

我也第一时间已经用上了：

能力大幅提升

Opus 4.1 在 SWE-bench Verified 上达到了 74.5% 的成绩，再次刷新了最先进的编码性能记录。

它还大幅提升了 Claude 的深度研究和数据分析能力，特别是在细节追踪和智能体搜索方面。

Anthropic 还贴出了合作伙伴们的实测结果：

GitHub 指出，Claude Opus 4.1 相比 Opus 4 在大多数能力上都有提升，特别是在多文件代码重构方面表现尤为突出。

Rakuten Group 发现 Opus 4.1 在大型代码库中精确定位修正位置的能力非常出色，它不会进行不必要的调整或引入 bug。他们的团队在日常调试任务中更偏爱这种精准度。

Windsurf 报告称，Opus 4.1 在他们的初级开发者基准测试上比 Opus 4 提升了一个标准差，显示出与从 Sonnet 3.7 到 Sonnet 4 的跳跃大致相同的性能飞跃。

轻松碾压对手

从基准测试数据来看，Opus 4.1 的表现相当亮眼。

在 TAU-bench、GPQA Diamond、MMMLU、MMMU、AIME 等多个基准上都展现出了强劲的实力。

值得注意的是，Claude 模型是混合推理模型。报告中的基准测试展示了在有或没有扩展思考情况下达到的最高分数：

无需扩展思考：SWE-bench Verified、Terminal-Bench
使用扩展思考（最多 64K tokens）：TAU-bench、GPQA Diamond、MMMLU、MMMU、AIME

如何使用

Anthropic 建议所有 Opus 4 用户都升级到 Opus 4.1。

开发者可以通过 API 使用 claude-opus-4-1-20250805。同时还可以查看系统卡片、模型页面、定价页面和文档了解更多信息。

网友纷纷激动不已

TestingCatalog News(@testingcatalog) 激动地评论：

实质性的重大改进 🤯

elvis(@omarsar0) 表示很高兴在 Claude Code 中使用这个版本：

很高兴能在 Claude Code 中使用这个版本。马上就去试试。

Chintan Patel(@FollowChintan) 惊叹道：

在 GPT-5 之前就有新的 Opus 更新，这是我没想到的！

当然也有用户关心价格问题，Hamza(@thegenioo) 询问：

我们能期待这个模型的价格下降吗？

还有用户在问 Sonnet 4.1 什么时候来，Yossi Dahan(@Yossi_Dahan_) 发出灵魂拷问：

小老弟 Sonnet 4.1 在哪里？😭

确实，只有4.1 Opus，而看不到 4.1 Sonnet……

The Canaanite(@mysticaltech) 对更新节奏表示赞赏：

喜欢这个，从过去的 6 个月周期中解脱出来，令人耳目一新。

当所有人都在等待 GPT-5 的时候，Anthropic 选择给出个小惊喜刷刷存在感的同时，也稳步提升了自己的模型能力。

以及，一边不让OpenAI 调用自己API，一边小发个新模型打乱Sam Altman 本就不太稳的节奏……

OpenAI's fired CEO Sam Altman to join Microsoft | Technology News | Al Jazeera

Anthropic 这发布节奏掌握得是真的好……先给你一个扎实的升级，再画一个不远的饼。

这次是个全面提升的小惊喜： Claude 4.1。

而承诺几周后的「实质性重大改进」会是什么呢？

Claude 5 吗？

[1]

Claude Opus 4.1 发布公告: https://www.anthropic.com/news/claude-opus-4-1

[2]

Claude Opus 4.1 系统卡片: https://www.anthropic.com/claude-opus-4-1-system-card

[3]

Claude Opus 模型页面: https://www.anthropic.com/claude/opus

[4]

API 定价: https://www.anthropic.com/pricing#api

[5]

开发文档: https://docs.anthropic.com/en/docs/about-claude/models/overview

👇

另外，我还用AI 进行了全网的AI 资讯采集，并用AI 进行挑选、审核、翻译、总结后发布到《AGI Hunt》的实时AI 快讯群中。

这是个只有信息、没有感情的 AI 资讯信息流（不是推荐流、不卖课、不讲道理、不教你做人、只提供信息、希望能为你节省一些时间）

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-05-26

Routa 桌面版发布：内建 Harness 工程的 AI Coding 研发协作工作台

2026-05-26

面壁智能BitCPM-CANN：端侧AI的内存革命

2026-05-26

AI Native 企业的关键，是从外化到内生

2026-05-26

真正开启Vibe Coding的第一天！

2026-05-26

Coding Agent 在百度的落地实践：从反馈闭环到工程范式重构

2026-05-26

刚刚，国产Agent模型闯入全球第一梯队！限时免费

2026-05-26

天工AI发布SkyClaw-v1.0：面向真实工作流的百万上下文 Agent 模型

2026-05-26

如何使用Codex的Goals机制完成长程任务？

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Claude Opus 4.7刚刚曝光！Claude Code一夜重构，7x24小时替你打工

2026-04-15

OpenAI Codex CLI 完整使用指南

2026-04-07

刚刚Qwen 3.6 Plus上线预览：1M上下文，阿里Coding/Agent翻身战打响

2026-03-31

2026年国内如何注册 Claude 账号教程

2026-03-13

Claude Code 和 Codex 接入 Figma MCP 保姆级教程

2026-04-07

独家| DeepSeek-V4终于要来了：梁文锋憋半年大招，多模态+长期记忆全面破局

2026-03-17

香港终于能直接用 Gemini 了，内地用户能用上吗？

2026-03-17

编程选GPT-5.4，还是GPT-5.3-Codex？

2026-03-21

GPT5.5来了，最大特点解析

2026-04-24

刚刚，GPT-5.4 发布，百万上下文、最强全能模型

2026-03-06

大家都在问

如何使用Codex的Goals机制完成长程任务？

2026-05-26

Codex 的 computer use 功能，为什么这么好用？

2026-05-23

前有用友YonClaw，今有金蝶灵基，中国软件双雄的AI底牌谁能笑到最后？

2026-05-21

Harness Engineering：AI 能在真正"出事会炸"的后端系统里写代码吗？

2026-05-19

谁来给企业端即将大规模入职的Agent盖办公室？

2026-05-09

鹅厂员工觉得好的code模型应该具备什么能力？

2026-05-09

Markdown要被抛弃了？Claude Code工程师自曝：我已彻底放弃使用Markdown！团队倾向使用HTML！网友：其他编辑工具会被淘汰吗？

2026-05-09

AI吞噬软件的叙事要分化了？

2026-05-08

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw