微信扫码
添加专属顾问
我要投稿
AI界新变革,Qwen3以小博大,引领新趋势。 核心内容: 1. Qwen3-4B超越Qwen2.5-72B,展现小模型潜力 2. Qwen3功能亮点:混合思维模式手动开关,优化MCP支持 3. Windsurf新免费计划升级,更多高级模型和功能免费开放
Qwen3明显发现自己当“AI界的汪峰”太久了,选了一个最平淡最没人关注的时间点发布了Qwen3。(当然这句话只限今天,只限现在,说不定今天DeepSeek R2就出来了?)
这次Qwen3最大的亮点就是:以小博大,Qwen3-4B直接干掉Qwen2.5-72B-Instruct,这牛也不是我吹的,官吹如下:
给人的感觉Qwen3是准备要换赛道了。
一是Qwen(汪峰)一出新品发布就被同行压着打;二是说实话,就我个人而言硬是找不到一星半点用它的理由,过去几个月使用频率也接近于0。之前还配合本地配置Ollama使用的,后来出了Google Gemma后就再没动过。
二是很少见大模型团队出这么小规模参数的Qwen3现在推这种小模型,极可能走硬件嵌入式道路,按4B这种小体格,各类低端的硬件随便跑。
以下是Qwen3模型发布的整理摘要:
模型列表
MoE架构模型
Qwen3-235B-A22B,顶尖模型应该是没有开源的。
总参数量:235B
激活参数:22B
上下文长度:128K
Qwen3-30B-A3B
总参数量:30B
激活参数:3B
上下文长度:128K
非MoE架构模型
关键新特性混合思维模式,可以手动开启关闭了,Qwen3新增thinking手动开关,支持用户控制思维链的显式开启/关闭。
这个功能虽然看起来不太起眼,但却是我个人觉得最为重要的一个功能,因为真的没有必要出现在所有的场景下都使用思考链。
就好比以前我吐槽微信搜索加入R1,问个天气还需要深度思考几秒钟。其实原本就只是请求一个接口就可以得到正确答案的事情。纯粹是为了蹭流量的硬加。
另外就是专门针对MCP强化编码和Agent任务表现,优化对MCP(多轮协作规划)的支持。
官方Demo已上线:http://chat.qwen.ai
测评排名和指标就不讲了,没有意义。
具体的实际体验报告,请关注微信公众号文章的后续推送。
不过这LOGO说实话我个人感觉真没老的醒目好看。
过去几周,Windsurf也简化了定价体系,为所有用户免费开放了GPT-4.1和o4-mini等尖端模型的使用权限(微信公众号后台回复Windsurf可看)。
今天,他们再次突破——对免费计划进行全方位升级。
免费用户现在享有 25次高级模型额度(原5次),配合GPT-4.1/o4-mini的0.25积分特惠价,相当于每月100次调用。
最大亮点:Cascade Base模型无限畅用,Write下的完整智能体体验。这一条同样适用于VSCode和JB系列。
无限制极速Tab补全,包含自动补全/超级补全/Tab跳转等付费级功能
另外还增加了应用部署权限:每日1次完整部署 + 无限次预览。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-04-30
Karpathy 最新访谈:Vibe Coding 只是开始,真正重要的是 Agentic Engineering
2026-04-30
近4万Star!一个终端把自己变成了AI开发环境,Cursor和Claude Code都沉默了
2026-04-29
Claude Code 的 Memory 系统:让 AI 记住你的偏好
2026-04-29
深入浅出Harness Engineerring之核心模式与理念
2026-04-28
别急着All-in DeepSeek V4,先看看这10位从业者的真心话
2026-04-28
你不知道的 Agent:原理、架构与工程实践
2026-04-27
从 Prompt 到 Harness,Agent 进入企业需要流程治理吗
2026-04-27
微信接入Claw类产品哪家强?SC-WeClaw首测:MiMoClaw夺冠
2026-04-15
2026-03-31
2026-03-13
2026-02-14
2026-02-03
2026-02-03
2026-02-03
2026-03-17
2026-02-09
2026-03-17
2026-04-26
2026-04-22
2026-04-18
2026-04-13
2026-04-12
2026-04-07
2026-04-01
2026-03-31