微信扫码
添加专属顾问
我要投稿
小模型Haiku 4.5性能直逼旗舰,速度翻倍成本大降,AI能力下沉速度超预期。 核心内容: 1. Haiku 4.5性能接近旗舰Sonnet 4,部分任务表现更优 2. 速度提升一倍多,API调用成本降低三分之一 3. 安全性表现突出,成为Anthropic最安全的模型
10分钟前,Anthropic 发布了 Claude Haiku 4.5
先说结论:
直到上个月,Sonnet 4 还都是旗舰模型,现在一个小模型就能达到
从完整的 benchmark 来看,Haiku 4.5 的表现很有意思
编程能力:
数学能力:
Computer Use:
说实话,在计算机使用这个任务上,Haiku 4.5 的表现确实让人意外
Anthropic 特别强调了速度这个点
原话是:more than twice the speed
体感就是:同样的任务,等待时间直接砍半,Claude Code 写代码的速度感会好很多
对于需要频繁调用 API 的应用来说,这个速度提升的价值可能比成本降低更重要
对比 Sonnet 4 的价格,Haiku 4.5 便宜了三分之一:
对比一下 Sonnet 4 的价格,Haiku 4.5 便宜了三分之一
部署渠道:
基本上,能用 Claude 的地方,现在都能用 Haiku 4.5
模型名称:claude-haiku-4-5
这里有个很有意思的点:Haiku 4.5 是 Anthropic 目前最安全的模型
按照 Anthropic 的自动化对齐评估,Haiku 4.5 的 misaligned behaviors 比例甚至低于 Sonnet 4.5 和 Opus 4.1
然后,因为在 CBRN(化学、生物、放射性、核武器)风险评估中表现良好,Haiku 4.5 被归类为 ASL-2
相比之下,Sonnet 4.5 和 Opus 4.1 都是更严格的 ASL-3
我觉得吧,Haiku 4.5 的发布,其实展示了一个很清晰的趋势:
AI 能力的「下沉」速度,远比我们想象的快
五个月前还是旗舰的性能,现在已经变成了小模型的标配
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-02-28
谷歌WebMCP 现已推出抢先预览版
2026-02-28
龙虾养成日记PPT看不过瘾?内部版逐字稿来了
2026-02-28
属于Agent的文件协议来了!Selfware让Agent之间无缝传递上下文
2026-02-28
对话 PallasAI:行业对 GEO 的理解都是错误的,我们想重新定义 GEO
2026-02-28
Claude Code远程控制体验:比OpenClaw更方便,但还在限量开启
2026-02-28
斩获30.5k Star!Claude Code长期记忆插件Claude-Mem开源,实现跨会话上下文无缝保留
2026-02-28
智能体技能构建手册:让AI真正"动手"的模块化艺术
2026-02-27
硬刚OpenClaw!Perplexity全新智能体系统可并行调度19个大模型,网友:可替代3万美金年费彭博终端
2026-01-24
2026-01-10
2026-01-01
2026-01-26
2026-02-03
2025-12-09
2025-12-21
2026-01-09
2026-02-16
2026-02-17
2026-02-27
2026-02-27
2026-02-26
2026-02-26
2026-02-24
2026-02-24
2026-02-20
2026-02-14