我要投稿

Qwen3快评：个人电脑变身AI工作站

发布日期：2025-05-10 19:49:55 浏览次数： 1761

作者：数据小虾米

微信搜一搜，关注“数据小虾米”

2025年4月29日，阿里发布了Qwen3大模型，引起了国内外社交媒体广泛关注。这里，我们不妨从技术和应用两个角度讨论下Qwen3。

根据官方公布的Qwen3改进主要集中在以下几个方面：

模型架构：采用了混合专家模型（MOE），并且在模型架构上支持“思考”和“非思考”两种模式。推测其技术基础可能源于 DeepSeek，优化思路类似于 Gemini 2.5 Flash 的两种模式统一，即通过强化学习对这两种模式进行对齐，从而实现更好的性能平衡。
数据集：大幅扩充至 36 万亿 tokens，是 Qwen2.5 的两倍。数据的来源包括从大型模型中提取的非结构化文档，以及专门构建的特定领域数据，例如数学、编程等。得益于数据集的扩充，QW3 模型现在支持 119 种语言。
预训练：采用了针对测评集任务的分阶段处理策略。首先训练语言技能和通用知识，然后是知识密集型数据（如 STEM、编程和推理），最后是高质量的长文本数据。这种分阶段训练的方式可能有助于模型更好地掌握不同类型的知识和技能。
模型产品：发布了两种类型的模型，分别是 Dense 模型和 MoE 模型。Dense 模型需要较大的内存（显存），但优点是延迟较低；而 MoE 模型则可以用更小的内存运行，但推理计算会更耗时。考虑近期智能体的火热，Qwen3也支持Agent MCP 能力。

小虾米评论：

从技术角度来看，QW3 并没有什么突破，更多的是在“炼丹”流程上的优化。然而，在应用层面，特别是开源的 MoE 模型在资源占用方面的优势，使得在个人电脑或边缘设备上离线使用接近当前主流模型能力成为可能。这对于企业级数据敏感场景以及端上离线应用具有巨大的潜力。

例如，Qwen3-30B-A3B 模型最低可以部署在 16GB 内存或 8GB 显存的机器上，主流个人电脑即装即用。而 Qwen3-235B-A22B 模型最低可以部署在 256GB 内存 + 24GB 显存的机器上。普通个人或企业只需花费数万元即可购买到符合该配置的设备。

另一方面，一些专业领域，如数学、推理、编程等，选择一些定制模型效果可能会更好。DeepSeek 在五一前发布的 DeepSeek-Prover-V2-671B即是一款数学定理证明的定制大模型。

对于大多数普通用户而言，当然选择满血版 Qwen3-235B-A22B 模型服务，又多了一个极低成本使用大模型的选择总是好的。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-08-11

Gemini CLI源码解析：Agent与上下文管理实现细节

2025-08-11

谷歌开源 LangExtract，用 LLM 精准提取万物信息

2025-08-11

谷歌开源结构化信息提取神器！4K+ Star，精准定位+交互式可视化！

2025-08-11

如何编写一个MCP服务并在大模型中调用？试试这个go语言框架

2025-08-11

3.6K Star 开箱即用！开源Agentic浏览器，Perplexity Comet最强平替！

2025-08-11

一文了解专为处理复杂结构文档的知识库：腾讯开源的WeKnora

2025-08-11

AI快讯：AI安全漏洞揭秘：副业者如何利用漏洞检测赚钱？

2025-08-11

Coze、Dify、n8n：三国争霸哪家强？

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

实测Qwen3-Coder，这就是目前最强的开源编程模型

2025-07-23

看大厂PM，如何玩转多个智能体开发平台

2025-06-17

53AI Hub重磅开源！让99%的智能体开发者赚到钱！

2025-06-17

Qwen3-Coder开源：面向世界的智能编程引擎

2025-07-23

有点东西！Qwen开源会写中文的生图模型Qwen-Image

2025-08-05

Kimi K2详测，Claude国产平替有了

2025-07-14

Kimi K2 详测｜超强代码和Agent 能力！内附Claude Code邪修教程

2025-07-12

字节重磅开源！Coze Studio + Coze Loop 助力AI Agent开发与运维一体化

2025-07-27

GLM-4.5 发布，六大主流模型混战测评，谁能一键生成“ 真·可用 ”的应用？

2025-07-29

GLM-4.5详测，这次智谱真的重回巅峰了

2025-07-29

大家都在问

AI快讯：AI安全漏洞揭秘：副业者如何利用漏洞检测赚钱？

2025-08-11

Coze、Dify、n8n：三国争霸哪家强？

2025-08-11

Agent应用爆发，谁成为向上托举的力量？

2025-08-06

OpenAI 为什么要开源大模型 gpt-oss？

2025-08-06

谁在拆 OpenAI 的围墙？

2025-08-06

OpenCSG ：企业级AI落地的全新选择，凭什么脱颖而出？

2025-08-04

为什么有AI Agent经验的产品经理更抢手？

2025-08-03

浪费我一上午！你们真的实测了 GLM-4.5 吗？

2025-08-02

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部