向大家介绍我们最新、最强开源基座模型:
Step 3.5 Flash!它具备强大的推理能力与 Agent 智能,为 Agent 而生。

性能 vs 模型尺寸
核心亮点如下:
更快:推理速度最高 350 TPS(单请求代码类任务)
更强:在 Agent 场景和数学任务上媲美闭源模型
更稳:胜任复杂、长链条任务

阴影柱状图为 Step 3.5 Flash 开启 Parallel Thinking 后的增强性能。左侧开源模型按总参数量排序,右侧为闭源模型。XBench-DeepSearch 数据源自官方发布。
我们不仅需要“更聪明”的模型,更需要“值得信任”、“响应迅速”、“成本可控”的模型。
Step 3.5 Flash 正是为此而来,我们采用:
稀疏 MoE 架构:每个 token 仅激活约 110 亿个参数(总计 1960 亿参数)
MTP-3:模型一次预测 4 个 Token,效率翻倍
3:1 滑动窗口与全局注意力混合架构(SWA + Full Attention):长文本中只看“重点”,显著降低计算开销,高效处理 256K 上下文
Step 3.5 Flash 现已全量上线,欢迎大家立刻开启体验,希望 Step 3.5 Flash 能够成为受大家喜爱的“Agent 搭子”!
OpenRouter 限免中,0 成本升级你的 Agent:https://openrouter.ai/stepfun/step-3.5-flash:free
GitHub 下载快速部署,打造专属 Agent:https://github.com/stepfun-ai/Step-3.5-Flash/tree/main
HuggingFace /魔搭社区获取模型权重:https://huggingface.co/stepfun-ai/Step-3.5-Flash;https://modelscope.cn/models/stepfun-ai/Step-3.5-Flash
下载「阶跃AI」APP 或前往阶跃 AI 网页端(https://www.stepfun.com/)免费使用。更多技术细节:https://static.stepfun.com/blog/step-3.5-flash/
🤫 此外我们专门优化了本地部署性能,支持在个人工作站(NVIDIA DGX Spark、Apple M3/M4 Max 或 AMD AI Max+ 395)上流畅运行。
