微信扫码
添加专属顾问
我要投稿
Step 3.5 Flash震撼开源!专为Agent打造的高性能模型,推理速度高达350 TPS,数学与复杂任务表现媲美闭源模型。 核心内容: 1. 模型三大核心优势:更快推理速度、更强任务表现、更稳长链条处理 2. 创新技术架构:稀疏MoE设计、MTP-3预测、混合注意力机制 3. 全渠道部署支持:OpenRouter限免、GitHub开源、工作站本地部署
向大家介绍我们最新、最强开源基座模型:
Step 3.5 Flash!它具备强大的推理能力与 Agent 智能,为 Agent 而生。
性能 vs 模型尺寸
核心亮点如下:
更快:推理速度最高 350 TPS(单请求代码类任务)
更强:在 Agent 场景和数学任务上媲美闭源模型
更稳:胜任复杂、长链条任务
阴影柱状图为 Step 3.5 Flash 开启 Parallel Thinking 后的增强性能。左侧开源模型按总参数量排序,右侧为闭源模型。XBench-DeepSearch 数据源自官方发布。
我们不仅需要“更聪明”的模型,更需要“值得信任”、“响应迅速”、“成本可控”的模型。
Step 3.5 Flash 正是为此而来,我们采用:
稀疏 MoE 架构:每个 token 仅激活约 110 亿个参数(总计 1960 亿参数)
MTP-3:模型一次预测 4 个 Token,效率翻倍
3:1 滑动窗口与全局注意力混合架构(SWA + Full Attention):长文本中只看“重点”,显著降低计算开销,高效处理 256K 上下文
Step 3.5 Flash 现已全量上线,欢迎大家立刻开启体验,希望 Step 3.5 Flash 能够成为受大家喜爱的“Agent 搭子”!
OpenRouter 限免中,0 成本升级你的 Agent:https://openrouter.ai/stepfun/step-3.5-flash:free
GitHub 下载快速部署,打造专属 Agent:https://github.com/stepfun-ai/Step-3.5-Flash/tree/main
HuggingFace /魔搭社区获取模型权重:https://huggingface.co/stepfun-ai/Step-3.5-Flash;https://modelscope.cn/models/stepfun-ai/Step-3.5-Flash
下载「阶跃AI」APP 或前往阶跃 AI 网页端(https://www.stepfun.com/)免费使用。更多技术细节:https://static.stepfun.com/blog/step-3.5-flash/
🤫 此外我们专门优化了本地部署性能,支持在个人工作站(NVIDIA DGX Spark、Apple M3/M4 Max 或 AMD AI Max+ 395)上流畅运行。
极致生成速度
在阶跃AI APP 上,Step 3.5 Flash 可以快速计算复杂数学题并输出正确答案。
Prompt:请在不使用外部工具的情况下,依次计算并列出以下等差数列的和:从第1项开始,首项为100,公差为-3的前50项和;1³ + 2³ + ... + 10³的和;1! + 2! + 3! + 4! + 5!的和;2^10 + 3^5的和;√144 + ∛125 + ⁴√16的和。
智能体编程
在本案例中,Step 3.5 Flash 基于一段文字 prompt 自动编程输出如下可视化平台结果。
Prompt:气象情报仪表盘——一款受飞行驾驶舱启发的三维地球可视化平台,专为高密度数据环境设计。其搭载的定制 WebGL 2.0 引擎,可实时处理超过 15,000 个动态节点及 WebSocket 遥测数据流。本案例展示了 Step 3.5 Flash 构建低延迟数据管道与高性能地理空间可视化系统的能力,并体现出对系统稳定性和专业级用户体验的专注追求。
端云结合
本案例中,用户提出对比 Mac Mini M4 在各平台的价格。Step 3.5 Flash 作为“云端大脑”,将这一复杂需求拆解为针对淘宝、京东和拼多多的具体子任务。这种云端规划显著降低了本地 Step-GUI 的执行难度,使其在从各应用抓取实时数据时获得更高成功率。随后 Step 3.5 Flash 汇总结果,识别出拼多多为最低价平台,并提供购买指南。这充分展现了“云端协同”的优势:云端智能简化本地端执行,从而确保可靠的结果产出。
我们已启动 Step 4 模型的训练,邀请大家深度参与共创。不只是使用者,更是定义者!让我们共同定义下一代 Agent 基础模型,一起探索智能上限!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-03-20
企业级 Agent 多智能体架构与选型指南 -- 来自1000+行业应用实践积累
2026-03-20
ollama v0.18.2 发布!OpenClaw 安装优化、Claude 加速、MLX 量化全面升级
2026-03-19
开源版Cowork——Eigent集成ERNIE 5.0,让AI Agent自动化高效工作
2026-03-17
打造 Claude Code 并行自主开发环境:Auto Claude + GLM 4.7
2026-03-17
又一款开源的LLM生成3D场景的3D编辑器,这次功能更强大了
2026-03-17
英伟达的NemoClaw,能帮AI代理这匹“野马”套上缰绳吗?
2026-03-17
腾讯混元AI Infra核心技术重磅开源:推理吞吐提升30%!
2026-03-17
英伟达重磅开源!Nemotron 3 Super:专为AI智能体打造的"超级大脑
2026-01-27
2026-01-30
2026-01-12
2026-01-29
2026-01-27
2025-12-22
2026-01-28
2026-01-21
2025-12-23
2026-01-06
2026-03-17
2026-03-13
2026-03-02
2026-02-05
2026-01-28
2026-01-26
2026-01-21
2026-01-21