免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


Claude Sonnet4.5发布,号称世界最强模型,超越gpt-5-codex

发布日期:2025-09-30 07:28:40 浏览次数: 1515
作者:AgenticAI

微信搜一搜,关注“AgenticAI”

推荐语

Claude Sonnet 4.5强势来袭,编程能力直逼GPT-5,这场AI大战你站哪边?

核心内容:
1. Claude Sonnet 4.5在编程基准测试中的突破性表现
2. 新增VS Code扩展和Chrome插件等实用功能
3. 两大新API功能助力构建更强大的AI Agent

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
就在DeepSeek V3.2发布" target="_blank" data-linktype="2">DeepSeek V3.2发布后不久,北京时间9月30日凌晨,敌对Anthropic发布Claude Sonnet 4.5,号称世界最强编程模型,上演一场狙击表演!要我说,敌对还是好好参考一下DeepSeek的DSA稀疏注意力,别再整什么量化降智的骚操作了!



回到Sonnet 4.5本身,可以看到4.5在Terminal Bench进入50%分位,在Agentic tool use的bench上更是有一个质的飞跃,从71来到了98,不会是蒸馏的gpt-5吧?因为他俩数值好接近。再一个就是Computer Use上也是质的飞跃,从44迈入61.4,好想看看gpt-5在该榜单表现…


Claude Code赢来升级,还带来VS Code扩展,可以通过检查点功能进行回退。所以说我看不懂Github推出Copilot CLI命令行的copilot是不是反向操作?


此外,Claude还可以使用代码分析数据创建文件以及可视化,他们的Chrome扩展插件也正式发布并公开给所有人使用,他们演示了使用Claude让浏览器自动发邮件和编辑Google Docs。



还带来了两个新的API
功能来构建Agent,且不会频繁达到上下文限制:
- 上下文编辑可自动清除陈旧的上下文
- 用于存储和查阅上下文窗口之外的信息的记忆工具

最后一个是临时研究预览版Imagine With Claude,只有Max可用。


价格保持一致,未有更新。到底还是敌对,DeepSeek R1发布的时候,那个CEO就是各种讽刺抵制,现在狙击的行为好明显。不过DeepSeek只是发了个实验版本,瞧把你吓得。


如果你觉得本篇分享不错的话,记得关注加🌟哦


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询