免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

GLM-5 发布:从“写代码”到“写工程”的范式跃迁

发布日期:2026-02-12 15:51:09 浏览次数: 1548
作者:OpenCSG社区

微信搜一搜,关注“OpenCSG社区”

推荐语

GLM-5的发布标志着AI从代码生成迈向系统工程的新纪元,技术突破与市场表现双丰收。

核心内容:
1. GLM-5的技术架构三大突破:参数扩容、异步强化学习框架、稀疏注意力机制
2. 在编程和智能体任务中的开源最优表现
3. 资本市场对技术突破的强烈反应与验证

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

2026 年 2 月 11 日深夜,智谱 AI 正式发布新一代旗舰模型 GLM-5。这不是一次常规的版本迭代,而是一场针对 Agentic Engineering 范式的系统性重构。当行业还在讨论“如何让 AI 写出更好的代码”时,GLM-5 已经将目标锁定在“如何让 AI 完成真实的系统工程”

神秘面纱下的实力验证

在 GLM-5 正式发布前,一个代号为 “Pony Alpha” 的匿名模型曾在全球模型服务平台 OpenRouter 上悄然登场。凭借出色的编码能力、200K 超长上下文窗口,以及针对智能体工作流的深度优化,这个神秘模型迅速在开发者社区引发热议,并一度登顶热度榜首

直到 2 月 11 日,谜底才揭晓——Pony Alpha 正是智谱 AI 的 GLM-5。这种“先用实力说话,再公布身份”的发布方式,本身就是对模型能力的最大自信。

市场反应强烈

模型发布当天,智谱 AI 的股价应声上涨 26%,本周累计涨幅约 70%,市值达到 1756.62 亿港币(约合人民币 1551.62 亿元)。资本市场的热烈反应,印证了 GLM-5 在技术突破上的含金量。

技术架构的三大突破

GLM-5 的能力跃升并非偶然,而是建立在三项关键技术突破之上。

混合专家架构示意图

参数规模与数据扩容

GLM-5 的参数规模从上一代的 355B 扩展至 744B,预训练数据从 23T 提升至 28.5T。但更重要的是,模型采用了稀疏混合专家(MoE)架构,每次推理仅需激活约 40B 参数,稀疏度控制在 5.9% 以内。这意味着在保持强大容量的同时,大幅降低了实际推理成本。

异步强化学习框架 Slime

GLM-5 构建了全新的 “Slime” 异步强化学习基础设施,支持更大模型规模及更复杂的强化学习任务。更关键的是,Slime 提出的异步智能体强化学习算法,使模型能够从长程交互中持续学习,这为 Agent 能力的提升提供了底层支撑。

稀疏注意力机制

GLM-5 集成了 DeepSeek 的稀疏注意力机制(DSA),在保证长文本处理效果的同时,显著降低了部署成本。这使得 200K 上下文窗口的实用性大幅提升,不再只是“参数表上的数字”。


开源 SOTA 的编程与 Agent 能力

编程开发场景

技术架构的升级最终要体现在实际能力上。GLM-5 在编程和智能体两大核心场景中,均达到了开源模型的最优表现(SOTA)

在权威基准测试中,GLM-5 的表现令人印象深刻:

  • SWE-bench Verified:得分 77.8,超越 Gemini 3 Pro(76.2),逼近 Claude Opus 4.6(80.9)

  • Terminal Bench 2.0:在终端操作任务中表现优异

  • BrowseComp:在需要检索和多步推理的任务中,GLM-5 在开源模型中排名第一

  • Vending Bench 2:在模拟商业运营的场景中,GLM-5 以最终余额 $4,432.12 位居开源模型榜首

更重要的是,内部评估显示,GLM-5 在前端、后端、长程任务等编程开发场景中,平均性能较上一代提升超 20%,真实编程体验逼近 Claude Opus 4.5 水平

在全球权威的 Artificial Analysis 榜单中,GLM-5 位居全球第四、开源第一,超越了两周前刚刚发布的 Moonshot Kimi K2.5,展现出国产大模型的快速迭代能力。


AI Agent 工作流程图

开发者工具生态:Z Code 与 OpenClaw

为配合 GLM-5 的发布,智谱同步推出了 Z Code 智能体开发环境。用户只需清晰表达需求,模型会自动拆解任务,多智能体并发完成代码编写、命令执行、调试、预览和提交等开发全流程。更令人惊讶的是,用户甚至可以用手机远程指挥桌面端 Agent,真正实现“随时随地写代码”。

值得一提的是,Z Code 本身就是由 GLM 模型全程参与开发的,这种“自举”能力恰好证明了模型在工程实践中的成熟度。

此外,GLM-5 已经一键接入 OpenClaw 框架,智谱推出的 AutoGLM 版本支持官网一键完成 OpenClaw 与飞书机器人的一体化配置。用户可以让 GLM-5 帮助搜索网站、定时整理资讯、发布推文、编程等任务。

GLM-5 还具备直接输出结构化文档的能力,可将文本或素材直接转换为 docx、pdf 和 xlsx 文件,在 Z.ai 和智谱清言上,用户可以让 GLM-5 直接输出产品需求文档、教案、试卷、电子表格、财务报告等文档。


从 Vibe Coding 到 Agentic Engineering

GLM-5 的发布背后,是对 AGI 发展范式的深刻洞察。

过去几年,大模型的主要应用场景是 “Vibe Coding”——快速生成原型、补全代码片段、解答技术问题。这种模式下,AI 是辅助工具,人类依然是主导者。

但 GLM-5 瞄准的是 “Agentic Engineering”——AI 能够自主分解高层目标为可执行的子任务,完成复杂的系统工程。在这种模式下,人类定义质量标准和验收条件,AI 负责执行和迭代。这不是简单的“写更多代码”,而是“理解工程目标、规划实施路径、处理异常情况、持续优化方案”的完整闭环

GLM-5 在长程 Agent 任务中的表现,正是这一范式转变的具体体现。模型不仅能够理解复杂的多步骤需求,还能在执行过程中进行自主决策和错误修正,这使得“AI 完成真实工程任务”从概念走向现实。


极致的性价比与开放策略

在能力提升的同时,GLM-5 在定价上展现出极强的竞争力。根据公开信息,GLM-5 的 API 调用成本约为:

  • 输入:$0.50 / 百万 tokens

  • 输出:$2.50 / 百万 tokens

这一价格比 Claude Opus 4.6(25)便宜约 6-10 倍,为开发者大规模应用提供了可能。

更重要的是,GLM-5 采用开源策略,承诺在 MIT 协议下发布模型权重。这意味着开发者不仅可以调用 API,还可以自主部署、微调和优化模型,真正掌握技术主动权。

值得一提的是,GLM-5 在训练过程中全程使用国产华为昇腾芯片,并已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等七家国产算力平台的深度推理适配。通过底层算子优化与硬件加速,GLM-5 在国产芯片集群上实现了高吞吐、低延迟的稳定运行,这在技术自主可控方面具有重要意义。


实际体验中的权衡

尽管 GLM-5 在基准测试中表现出色,但早期用户的反馈也揭示了一些值得注意的特点。

安全协议初创公司 Andon Labs 的联合创始人 Lukas Petersson 在测试后评论:“一个极其有效的模型,但情境感知能力较弱。”这提示我们,GLM-5 在执行明确定义的任务时表现优异,但在需要理解隐含上下文或处理模糊需求时,可能还需要更清晰的提示词设计。

此外,GLM-5 的推理速度约为 17-19 tokens/秒,相比竞品的 25-30+ tokens/秒略慢。对于需要高吞吐量的应用场景,这是需要权衡的因素。

但这些权衡在特定场景下是值得的。对于需要深度推理、多步规划的复杂任务,GLM-5 的稳定性和准确性优势更为明显。正如一位开发者所说:“如果你需要处理大量小查询,DeepSeek 可能更合适;但如果是少量深度调用,GLM-5 的表现让人放心。”

开发者社区的真实反馈

已有开发者在实际项目中测试了 GLM-5 的能力。有开发者让自己的 OpenClaw Agent 用不同模型进行 SwiftUI 编程测试,GLM-5 的表现优于 Minimax M2.1。另一位开发者让 GLM-5、GLM-4.7 和 Opus 4.6 进行 3D 网页开发对比,认为 GLM-5 的升级幅度很大,与 Opus 4.6 存在一些品味方面的差异,但整体能力已经相当接近。

更有开发者用 GLM-5 复刻了知名游戏《星露谷物语》,模型能够像项目经理一样分析核心需求,梳理出八大系统与配色方案,并像架构师一样规划项目整体架构,打造出初步可玩的游戏界面。当开发者提出“进一步丰富游戏”这样的模糊需求时,GLM 可以自行规划并打造出完成度更高的游戏。


写在最后

GLM-5 的发布,标志着国产大模型在技术路径与能力表现上持续缩小与国际领先水平的差距。更重要的是,它为“AI 如何真正参与工程实践”提供了一个可行的方向。

从“写代码”到“写工程”,从辅助工具到自主智能体,这不仅是技术能力的提升,更是应用范式的转变。GLM-5 的出现,让我们看到了 Agentic Engineering 时代的曙光——AI 不再只是提高效率的工具,而是能够承担复杂工程任务的协作伙伴

当然,这一切才刚刚开始。GLM-5 在开源社区的表现、实际应用中的稳定性、与其他工具的集成能力,都需要时间和实践来验证。但至少在这个春节档,国产大模型再次用实力证明:我们不仅在追赶,更在探索属于自己的技术路径。



社区地址

OpenCSG社区https://opencsg.com/models/zai-org/GLM-5

hf社区https://huggingface.co/zai-org/GLM-5


关于 OpenCSG

OpenCSG 是全球领先的开源大模型社区平台,致力于打造开放、协同、可持续生态,AgenticOps人工智能领域的一种AI原生方法论,由OpenCSG(开放传神)提出。AgenticOps是Agentic AI的最佳落地实践也是方法论。核心产品 CSGHub 提供模型、数据集、代码与 AI 应用的 一站式托管、协作与共享服务,具备业界领先的模型资产管理能力,支持多角色协同和高效复用。

更多推荐






53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询