微信扫码
添加专属顾问
我要投稿
GLM-4.7-Flash无审查版重磅发布,30B MoE架构带来高效推理体验,支持200K超长上下文,满足不同场景需求。 核心内容: 1. 模型特点:30B-A3B混合专家架构,仅激活3B参数实现快速推理 2. 版本选择:平衡版与激进版分别适用于不同应用场景 3. 技术细节:提供多种量化格式,兼容主流推理框架
GLM-4.7-Flash的无审查版本现已发布,由HauhauCS制作。该模型基于Z.ai的原版GLM-4.7-Flash,但移除了所有审查机制。
模型采用30B-A3B混合专家架构,总参数量31B,但每次前向传播仅激活约3B参数,这意味着推理速度会很快。同时支持200K的上下文长度。
目前提供了四种量化格式:
| 量化类型 | 文件大小 |
|---|---|
| FP16 | 56 GB |
| Q8_0 | 30 GB |
| Q6_K | 23 GB |
| Q4_K_M | 17 GB |
根据Z.ai官方的建议:
通用用途:
--temp 1.0 --top-p 0.95工具调用/智能体场景:
--temp 0.7 --top-p 1.0重要提示:
--repeat-penalty 1.0)--min-p 0.01(默认0.05过高)--jinja标志目前与Ollama存在聊天模板兼容性问题,建议使用llama.cpp、LM Studio、Jan或koboldcpp。
HauhauCS表示,这些无审查版本的目标是尽可能无损地保留原版模型的能力,只是移除了拒绝机制。对于需要更小模型的用户,他还发布了GPT-OSS 20B的无审查版本。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-03-12
阿里开源龙虾组合来了:HiClaw + CoPaw,内存占用大幅降低,还能直接操作本地环境
2026-03-12
大厂抢的不是“龙虾”,是人与AI的新型关系
2026-03-11
Google Workspace 团队开源了一个工具,叫 gws,直接搬进终端里了。
2026-03-11
OpenClaw爆火背后,我们所见的时代情绪 | Linear View
2026-03-11
开源 AI 收藏夹:全平台同步、自动摘要、智能对话,太强了!
2026-03-11
OpenAI 开源 Symphony!四天狂揽 8.7K Star,AI 编程自主管理神器!
2026-03-10
龙虾没那么神,一场注定退潮的AI狂欢
2026-03-09
OpenAI 刚开源了 Symphony:以后写代码,你只需要拖工单就行了
2026-01-27
2026-01-30
2026-01-12
2026-01-29
2026-01-27
2026-01-28
2025-12-22
2026-01-21
2025-12-23
2026-01-06
2026-03-02
2026-02-05
2026-01-28
2026-01-26
2026-01-21
2026-01-21
2026-01-20
2026-01-16