微信扫码
添加专属顾问
我要投稿
Claude Sonnet 4.5强势来袭,编程能力直逼GPT-5,这场AI大战你站哪边? 核心内容: 1. Claude Sonnet 4.5在编程基准测试中的突破性表现 2. 新增VS Code扩展和Chrome插件等实用功能 3. 两大新API功能助力构建更强大的AI Agent
回到Sonnet 4.5本身,可以看到4.5在Terminal Bench进入50%分位,在Agentic tool use的bench上更是有一个质的飞跃,从71来到了98,不会是蒸馏的gpt-5吧?因为他俩数值好接近。再一个就是Computer Use上也是质的飞跃,从44迈入61.4,好想看看gpt-5在该榜单表现…
Claude Code赢来升级,还带来VS Code扩展,可以通过检查点功能进行回退。所以说我看不懂Github推出Copilot CLI命令行的copilot是不是反向操作?
此外,Claude还可以使用代码分析数据创建文件以及可视化,他们的Chrome扩展插件也正式发布并公开给所有人使用,他们演示了使用Claude让浏览器自动发邮件和编辑Google Docs。
最后一个是临时研究预览版Imagine With Claude,只有Max可用。
价格保持一致,未有更新。到底还是敌对,DeepSeek R1发布的时候,那个CEO就是各种讽刺抵制,现在狙击的行为好明显。不过DeepSeek只是发了个实验版本,瞧把你吓得。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-01-13
ISON:比JSON节省70% token的数据格式,专为LLM设计
2026-01-13
别再造Agent了!关于Agent Skills的详细总结来了
2026-01-13
美团龙猫LongCat技术升级!新注意力机制解码速度快10倍,还能处理1M超长文本
2026-01-13
再见了 H100!刚刚 DeepSeek 甩出王炸:显卡不够内存凑,堆 CPU 就能无限扩展“知识库”!
2026-01-13
Anthropic 万字长文:AI Agent 评估体系全解析
2026-01-13
Claude 的新功能 Cowork:让 AI 真正帮你干活
2026-01-13
Claude Cowork 重磅发布:整理文件、做表格、写报告,全包!
2026-01-13
Google 宣布将 Opal 集成进 Gemini Gem里 现在你可以在 “Gems 管理器”中直接使用Opal开发应用
2025-10-26
2025-11-19
2025-10-20
2025-11-13
2025-10-18
2025-10-21
2025-11-03
2025-10-23
2025-10-22
2025-10-20
2026-01-12
2026-01-12
2026-01-11
2026-01-10
2026-01-10
2026-01-08
2026-01-02
2025-12-31