微信扫码
添加专属顾问
我要投稿
Step 3.5 Flash震撼开源!专为Agent打造的高性能模型,推理速度高达350 TPS,数学与复杂任务表现媲美闭源模型。核心内容: 1. 模型三大核心优势:更快推理速度、更强任务表现、更稳长链条处理 2. 创新技术架构:稀疏MoE设计、MTP-3预测、混合注意力机制 3. 全渠道部署支持:OpenRouter限免、GitHub开源、工作站本地部署
向大家介绍我们最新、最强开源基座模型:
Step 3.5 Flash!它具备强大的推理能力与 Agent 智能,为 Agent 而生。
性能 vs 模型尺寸
核心亮点如下:
更快:推理速度最高 350 TPS(单请求代码类任务)
更强:在 Agent 场景和数学任务上媲美闭源模型
更稳:胜任复杂、长链条任务
阴影柱状图为 Step 3.5 Flash 开启 Parallel Thinking 后的增强性能。左侧开源模型按总参数量排序,右侧为闭源模型。XBench-DeepSearch 数据源自官方发布。
我们不仅需要“更聪明”的模型,更需要“值得信任”、“响应迅速”、“成本可控”的模型。
Step 3.5 Flash 正是为此而来,我们采用:
稀疏 MoE 架构:每个 token 仅激活约 110 亿个参数(总计 1960 亿参数)
MTP-3:模型一次预测 4 个 Token,效率翻倍
3:1 滑动窗口与全局注意力混合架构(SWA + Full Attention):长文本中只看“重点”,显著降低计算开销,高效处理 256K 上下文
Step 3.5 Flash 现已全量上线,欢迎大家立刻开启体验,希望 Step 3.5 Flash 能够成为受大家喜爱的“Agent 搭子”!
OpenRouter 限免中,0 成本升级你的 Agent:https://openrouter.ai/stepfun/step-3.5-flash:free
GitHub 下载快速部署,打造专属 Agent:https://github.com/stepfun-ai/Step-3.5-Flash/tree/main
HuggingFace /魔搭社区获取模型权重:https://huggingface.co/stepfun-ai/Step-3.5-Flash;https://modelscope.cn/models/stepfun-ai/Step-3.5-Flash
下载「阶跃AI」APP 或前往阶跃 AI 网页端(https://www.stepfun.com/)免费使用。更多技术细节:https://static.stepfun.com/blog/step-3.5-flash/
🤫 此外我们专门优化了本地部署性能,支持在个人工作站(NVIDIA DGX Spark、Apple M3/M4 Max 或 AMD AI Max+ 395)上流畅运行。
极致生成速度
在阶跃AI APP 上,Step 3.5 Flash 可以快速计算复杂数学题并输出正确答案。
Prompt:请在不使用外部工具的情况下,依次计算并列出以下等差数列的和:从第1项开始,首项为100,公差为-3的前50项和;1³ + 2³ + ... + 10³的和;1! + 2! + 3! + 4! + 5!的和;2^10 + 3^5的和;√144 + ∛125 + ⁴√16的和。
(视频全程未加速)
智能体编程
在本案例中,Step 3.5 Flash 基于一段文字 prompt 自动编程输出如下可视化平台结果。
Prompt:气象情报仪表盘——一款受飞行驾驶舱启发的三维地球可视化平台,专为高密度数据环境设计。其搭载的定制 WebGL 2.0 引擎,可实时处理超过 15,000 个动态节点及 WebSocket 遥测数据流。本案例展示了 Step 3.5 Flash 构建低延迟数据管道与高性能地理空间可视化系统的能力,并体现出对系统稳定性和专业级用户体验的专注追求。
端云结合
本案例中,用户提出对比 Mac Mini M4 在各平台的价格。Step 3.5 Flash 作为“云端大脑”,将这一复杂需求拆解为针对淘宝、京东和拼多多的具体子任务。这种云端规划显著降低了本地 Step-GUI 的执行难度,使其在从各应用抓取实时数据时获得更高成功率。随后 Step 3.5 Flash 汇总结果,识别出拼多多为最低价平台,并提供购买指南。这充分展现了“云端协同”的优势:云端智能简化本地端执行,从而确保可靠的结果产出。
我们已启动 Step 4 模型的训练,邀请大家深度参与共创。不只是使用者,更是定义者!让我们共同定义下一代 Agent 基础模型,一起探索智能上限!
快来 Discord 找我们🚀: https://discord.gg/RcMJhNVAQc
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-02-03
暴涨11.7k Star!复刻Manus上下文工程的开源Skills,Claude code等多个平台即插即用
2026-02-03
ollama v0.15.4 更新:OpenClaw全面上线,优化集成流程与工具解析能力大升级!
2026-02-02
一分钟部署OpenClaw+QQ,国内最爽的一键启动!
2026-02-02
这家字节系AI初创,推出首个开源Agent Skills Builder!对话Refly.AI李锦威:大多数Agent都停留在专业用户层面,没有做到真正的普惠
2026-02-02
OCR又出宠OpenDoc,速度超MinerU6倍
2026-02-02
月之暗面发布 Kimi K2.5:一个模型,百个智能体,重新定义 AI 协作效率
2026-02-02
Google重磅开源!用AI读懂你的“天书”,LangExtract让非结构化文本瞬间结构化!
2026-02-02
火爆全网的OpenClaw 有汉化发行版了
2025-11-19
2026-01-27
2025-12-22
2025-12-10
2025-11-17
2026-01-12
2025-11-07
2025-12-23
2026-01-06
2026-01-28
2026-01-28
2026-01-26
2026-01-21
2026-01-21
2026-01-20
2026-01-16
2026-01-02
2025-12-24