微信扫码
添加专属顾问
我要投稿
探索qwen3系列模型,体验多语言和混合思维模式的强大能力。 核心内容: 1. qwen3系列模型架构概览,包含密集型和混合专家型模型 2. 混合思维模式,灵活控制模型思考程度 3. 旗舰模型Qwen3-235B-A22B在多个基准测试中的出色表现
思考模式和非思考模式,使用户能够根据具体任务控制模型进行思考的程度密集模型
MoE 模型
从官方公布的基准测试看,
旗舰模型
Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型相比,表现出极具竞争力的结果。此外,小型 MoE 模型Qwen3-30B-A3B的激活参数数量是 QwQ-32B 的 10%,表现更胜一筹,甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。
Qwen3 使用约 36 万亿 Token,在预训练阶段分为 3 步:
在后训练分为 4 步
大规模强化学习,利用基于规则的奖励来增强模型的探索和钻研能力qwen3 模型需要 ollama v0.6.6 或更高版本,先把 Linux 上的 ollama 升级到 v0.6.6:
wget https://github.com/ollama/ollama/releases/download/v0.6.6/ollama-linux-amd64.tgz
sudo systemctl stop ollama
sudo rm -rf /usr/lib/ollama
sudo tar -C /usr -xzf ollama-linux-amd64.tgz
sudo systemctl start ollama升级完后,下载 qwen3:8b模型,大小在 5.2G
$ ollama pull qwen3:8b
pulling manifest
pulling a3de86cd1c13: 100% ▕████████████████████████████████████████████████████████████████████████████████████████████████████████▏ 5.2 GB
pulling eb4402837c78: 100% ▕████████████████████████████████████████████████████████████████████████████████████████████████████████▏ 1.5 KB
pulling d18a5cc71b84: 100% ▕████████████████████████████████████████████████████████████████████████████████████████████████████████▏ 11 KB
pulling cff3f395ef37: 100% ▕████████████████████████████████████████████████████████████████████████████████████████████████████████▏ 120 B
pulling 05a61d37b084: 100% ▕████████████████████████████████████████████████████████████████████████████████████████████████████████▏ 487 B
verifying sha256 digest
writing manifest
success配置好模型后,在 LobeChat 中使用 qwen3:8b 看下实际效果:
在内容分类方面,DeepSeek-R1:14B 和 qwen3:8b 旗鼓相当。
在内容分类方面,DeepSeek-R1:14B 吊打 qwen3:8b。
总的来说各有千秋,要根据实际效果选择模型。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-04-11
那个“爱马仕”,想拯救“智障”小龙虾
2026-04-10
重磅!Anthropic官方Harnerss发布了!
2026-04-10
刚刚,100 美金的 ChatGPT 来了
2026-04-09
技术教科书:顶级开发团队设计的Harness工程项目源码什么样
2026-04-09
Anthropic 官方 Harness 发布:全面解读 Managed Agents
2026-04-09
SDD-RIPER 团队落地指南:如何让整个团队在一周内跑通大模型编程
2026-04-09
Claude Managed Agents 公测发布!Agent 开发成本直降 500 倍
2026-04-09
Anthropic 今天发了一个新产品,可能会让一批做 AI 智能体基础设施的团队失业
2026-01-24
2026-01-26
2026-01-23
2026-03-31
2026-01-14
2026-03-13
2026-01-21
2026-02-03
2026-02-03
2026-02-03
2026-04-07
2026-04-01
2026-03-31
2026-03-31
2026-03-22
2026-03-22
2026-03-21
2026-03-20