我要投稿

GLM-4.7-Flash无审查版发布：30B MoE模型，仅3B激活参数

发布日期：2026-01-25 09:27:10 浏览次数： 2358

作者：AI工程化

微信搜一搜，关注“AI工程化”

GLM-4.7-Flash的无审查版本现已发布，由HauhauCS制作。该模型基于Z.ai的原版GLM-4.7-Flash，但移除了所有审查机制。

模型采用30B-A3B混合专家架构，总参数量31B，但每次前向传播仅激活约3B参数，这意味着推理速度会很快。同时支持200K的上下文长度。

两种变体

平衡版：适合需要可靠性的智能体编码场景，在保持能力的同时不会过度拒绝请求
激进版：适合其他所有无审查主题

量化版本

目前提供了四种量化格式：

量化类型	文件大小
FP16	56 GB
Q8_0	30 GB
Q6_K	23 GB
Q4_K_M	17 GB

技术规格

模型架构：30B-A3B MoE（31B总参数，~3B激活参数）
上下文长度：202K
基础模型：zai-org/GLM-4.7-Flash

兼容性

目前与Ollama存在聊天模板兼容性问题，建议使用llama.cpp、LM Studio、Jan或koboldcpp。

HauhauCS表示，这些无审查版本的目标是尽可能无损地保留原版模型的能力，只是移除了拒绝机制。对于需要更小模型的用户，他还发布了GPT-OSS 20B的无审查版本。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-03-12

阿里开源龙虾组合来了：HiClaw + CoPaw，内存占用大幅降低，还能直接操作本地环境

2026-03-12

大厂抢的不是“龙虾”，是人与AI的新型关系

2026-03-11

Google Workspace 团队开源了一个工具，叫 gws，直接搬进终端里了。

2026-03-11

OpenClaw爆火背后，我们所见的时代情绪 | Linear View

2026-03-11

开源 AI 收藏夹：全平台同步、自动摘要、智能对话，太强了！

2026-03-11

OpenAI 开源 Symphony！四天狂揽 8.7K Star，AI 编程自主管理神器！

2026-03-10

龙虾没那么神，一场注定退潮的AI狂欢

2026-03-09

OpenAI 刚开源了 Symphony：以后写代码，你只需要拖工单就行了

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Clawdbot 完整安装教学：2026 年最火的开源AI 个人助理

2026-01-27

重磅开源！Kimi K2.5 本地部署全攻略：手把手教你跑通 1T MoE 巨兽

2026-01-30

SkillsMP：一个聚合了 5 万+ AI Agent 技能的开源社区

2026-01-12

Clawdbot 深度拆解： 7 个问题看懂它。

2026-01-29

实测Kimi K2.5，这是一款厌丑的开源模型

2026-01-27

ClawdBot 火爆全网，手把手教你如何部署，还能直接用钉钉操作！

2026-01-28

2025-12-22

OpenWork：Claude Cowork 的开源替代品

2026-01-21

我把Claude Code换成GLM-4.7用了6小时，我竟然没发现明显区别

2025-12-23

Claude Code最强开源对手！GitHub 50.2k Star了，作者为它烧掉2.4w美元。

2026-01-06

大家都在问

137K 行代码、零 clippy 警告：这个开源项目凭什么让 AI Agent 领域炸锅？

2026-03-02

Clawdbot 如何实现像人一样的长期记忆？

2026-02-05

一夜爆火，Clawdbot是否才是真正的AI入口产品？

2026-01-28

Clawdbot爆火：Karpathy点赞的开源AI助理，到底是什么？

2026-01-26

速递 | DeepSeek突然扔出MODEL1，这到底是V4还是R2？

2026-01-21

DeepSeek-R2要来了？

2026-01-21

TranslateGemma-27B谷歌开源翻译模型有多强？

2026-01-20

构建开放智能体生态：AgentScope 如何用 A2A 协议与 Nacos 打通协作壁垒？

2026-01-16

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean Openclaw

GLM-4.7-Flash无审查版发布：30B MoE模型，仅3B激活参数

两种变体

量化版本

技术规格

推荐设置

兼容性