微信扫码
添加专属顾问
我要投稿
GLM-4.7-Flash无审查版重磅发布,30B MoE架构带来高效推理体验,支持200K超长上下文,满足不同场景需求。核心内容: 1. 模型特点:30B-A3B混合专家架构,仅激活3B参数实现快速推理 2. 版本选择:平衡版与激进版分别适用于不同应用场景 3. 技术细节:提供多种量化格式,兼容主流推理框架
GLM-4.7-Flash的无审查版本现已发布,由HauhauCS制作。该模型基于Z.ai的原版GLM-4.7-Flash,但移除了所有审查机制。
模型采用30B-A3B混合专家架构,总参数量31B,但每次前向传播仅激活约3B参数,这意味着推理速度会很快。同时支持200K的上下文长度。
目前提供了四种量化格式:
| 量化类型 | 文件大小 |
|---|---|
| FP16 | 56 GB |
| Q8_0 | 30 GB |
| Q6_K | 23 GB |
| Q4_K_M | 17 GB |
根据Z.ai官方的建议:
通用用途:
--temp 1.0 --top-p 0.95工具调用/智能体场景:
--temp 0.7 --top-p 1.0重要提示:
--repeat-penalty 1.0)--min-p 0.01(默认0.05过高)--jinja标志目前与Ollama存在聊天模板兼容性问题,建议使用llama.cpp、LM Studio、Jan或koboldcpp。
HauhauCS表示,这些无审查版本的目标是尽可能无损地保留原版模型的能力,只是移除了拒绝机制。对于需要更小模型的用户,他还发布了GPT-OSS 20B的无审查版本。
模型链接:
关注公众号回复“进群”入群讨论。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-01-25
48 个专家级技能包!这个开源库让你的 Claude 瞬间进化,营销、代码、管理样样精通!
2026-01-25
阿里开源 Qwen3-TTS 全家桶!语音设计、克隆、生成全打包,开源 2 天 3K Star!
2026-01-24
当 AI 学会"造沙箱":OpenSandbox 如何让大模型安全地执行代码
2026-01-24
Claude Code 重磅升级:Task 正式取代 Todo,专治多会话、长周期大工程
2026-01-23
国内外主流AI Agent开发框架与平台深度解析
2026-01-23
为什么你一定要用OpenCode
2026-01-23
阿里云为何要将数据采集开发套件开源
2026-01-23
只需 4 步搞定!开源文档解析服务 MinerU-API 最新安装指南
2025-11-19
2025-10-27
2025-10-27
2025-12-22
2025-11-17
2025-12-10
2025-11-07
2025-10-29
2025-12-23
2026-01-06
2026-01-21
2026-01-21
2026-01-20
2026-01-16
2026-01-02
2025-12-24
2025-12-22
2025-11-12