免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


Claude Haiku 4.5 发布:小模型比肩 GPT-5

发布日期:2025-10-16 05:27:50 浏览次数: 1523
作者:赛博禅心

微信搜一搜,关注“赛博禅心”

推荐语

小模型Haiku 4.5性能直逼旗舰,速度翻倍成本大降,AI能力下沉速度超预期。

核心内容:
1. Haiku 4.5性能接近旗舰Sonnet 4,部分任务表现更优
2. 速度提升一倍多,API调用成本降低三分之一
3. 安全性表现突出,成为Anthropic最安全的模型

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

10分钟前,Anthropic 发布了 Claude Haiku 4.5


先说结论

  • 性能接近五个月前的旗舰 Sonnet 4
  • 成本降到三分之一,速度快了一倍多
  • 某些任务上甚至超过 Sonnet 4

直到上个月,Sonnet 4 还都是旗舰模型,现在一个小模型就能达到

性能表现


Image

从完整的 benchmark 来看,Haiku 4.5 的表现很有意思

编程能力

  • Agentic coding(SWE-bench):73.3%
  • Terminal coding:41.0%
  • 跟 Sonnet 4(72.7%、36.4%)基本持平

数学能力

  • Python 工具支持:96.3%
  • 无工具:80.7%
  • 这个表现甚至超过了很多大模型

Computer Use

  • OSWorld:50.7%
  • 这个成绩是亮点,直接超过 Sonnet 4 的 42.2%

说实话,在计算机使用这个任务上,Haiku 4.5 的表现确实让人意外

速度升级

Anthropic 特别强调了速度这个点

原话是:more than twice the speed

体感就是:同样的任务,等待时间直接砍半,Claude Code 写代码的速度感会好很多

对于需要频繁调用 API 的应用来说,这个速度提升的价值可能比成本降低更重要

价格便宜

对比 Sonnet 4 的价格,Haiku 4.5 便宜了三分之一

  • 输入:$1 / 百万 tokens
  • 输出:$5 / 百万 tokens

对比一下 Sonnet 4 的价格,Haiku 4.5 便宜了三分之一

部署渠道

  • Claude API
  • Amazon Bedrock
  • Google Cloud Vertex AI
  • Claude Code
  • Claude 网页版和 App

基本上,能用 Claude 的地方,现在都能用 Haiku 4.5

模型名称:claude-haiku-4-5

安全性

这里有个很有意思的点:Haiku 4.5 是 Anthropic 目前最安全的模型

按照 Anthropic 的自动化对齐评估,Haiku 4.5 的 misaligned behaviors 比例甚至低于 Sonnet 4.5 和 Opus 4.1

然后,因为在 CBRN(化学、生物、放射性、核武器)风险评估中表现良好,Haiku 4.5 被归类为 ASL-2

相比之下,Sonnet 4.5 和 Opus 4.1 都是更严格的 ASL-3

最后说两句

我觉得吧,Haiku 4.5 的发布,其实展示了一个很清晰的趋势:

AI 能力的「下沉」速度,远比我们想象的快

五个月前还是旗舰的性能,现在已经变成了小模型的标配


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询