近日,阶跃星辰正式开源了一款全新的深度研究模型 ——Step-DeepResearch。这款模型拥有320亿参数,致力于在开放式研究环境中进行自主的信息探索和专业报告生成。根据官方介绍,Step-DeepResearch 在深度研究能力上已接近 OpenAI 的 o3-mini 和 Gemini2.0Flash 等顶级商业模型,但其部署成本却仅为传统模型的十分之一,单次调用成本低于0.5元人民币。

image.png

Step-DeepResearch 的设计理念十分独特。它通过将复杂的研究任务分解为多个可训练的 “原子能力”,如规划、信息检索、反思和交叉验证,从而实现闭环反思和动态校正。这种方法不仅提升了模型在复杂环境中的自适应能力,也增强了其泛化性能。模型的训练流程经过精心设计,从智能体中期训练到监督式微调(SFT 以及强化学习(RL),确保其在复杂的实际应用中表现出色。

在测试中,Step-DeepResearch 在 Scale AI Research Rubrics 中获得了61.4% 的高分,这一成绩与一些更大规模的模型如 OpenAI Deep Research 和 Gemini Deep Research 不相上下。此外,在 ADR-Bench 的专家评估中,Step-DeepResearch 的 Elo 评分更是显著高于许多竞争对手,展示了其在深度研究领域的强大能力。

为了支持科研工作流程,Step-DeepResearch 采用了基于 ReAct 范式的单智能体架构,具备推理、行动和反思的动态循环。通过内部的专有工具集,该系统能够高效进行批量网页搜索、文件管理和交互式命令执行等任务,为研究人员提供了极大的便利。

github:https://github.com/stepfun-ai/StepDeepResearch

划重点:  

✨ Step-DeepResearch 是阶跃星辰最新开源的深度研究模型,参数规模320亿。  

💡 该模型在深度研究能力上接近顶级商业模型,但其成本仅为传统模型的十分之一。  

🚀 通过独特的训练流程和动态循环架构,Step-DeepResearch 在科研工作中提供了高效的支持。