Step-DeepResearch是上海阶跃星辰智能科技有限公司于2026年1月26日推出的端到端深度研究智能体模型,凭借其独特的技术架构和卓越的性能表现,在AI深度研究领域引发了广泛关注。这款320亿参数(32B)的模型通过将复杂的研究流程内化为可训练的原子能力,实现了从信息检索到专业报告生成的全闭环研究工作流。Step-DeepResearch在多项权威评测中表现优异,其在Research Rubrics评测中得分61.42%,仅次于Gemini DeepResearch(约63.69分),超越了OpenAI DeepResearch,

        并在"引用质量"和"沟通质量"两个维度达到行业最高水平。同时,其部署成本比同类产品降低90%,展现出极高的性价比优势。


一、技术架构与核心创新

        Step-DeepResearch的核心创新主要体现在三个方面:基于原子能力的数据合成策略、渐进式智能体训练范式和自建ADR-Bench评估体系。

1. 单智能体架构与动态循环

        Step-DeepResearch采用基于ReAct范式的单智能体架构,将深度研究任务重构为动态的推理-行动-观察循环。系统周期性地通过三个核心阶段:规划与反思、工具执行、反馈与交叉验证。这一架构设计使得模型能够自主规划研究路径,执行信息检索,并对结果进行反思与验证,最终生成专业报告。

        与多智能体架构相比,单智能体架构具有以下优势:

降低系统复杂度:无需多个智能体之间的协调与通信

减少推理延迟:单次推理即可完成闭环反思与动态校正

提高执行一致性:所有决策与行动由单一模型控制,避免信息传递误差 

2. 原子能力训练法

        Step-DeepResearch采用独特的原子能力训练法,将复杂研究任务分解为四个可训练的原子能力,并在模型层面深度内化:

规划与任务分解:能将模糊、宏大的用户需求拆解为可执行的子任务,并根据环境反馈动态调整路径

深层信息获取:具备多跳推理能力,在信息不完整时能进行"主动拓扑行走",挖掘隐藏实体

反思与验证:拥有"自纠错"和"事实核查"能力,能识别自身错误并区分网络信息真伪,通过跨源验证确保逻辑严密

专业报告生成:通过中期训练学习专家写作风格,利用SFT确保报告严格遵循规划结构和引用规范

        这种原子能力训练法使Step-DeepResearch能够像人类专家一样思考和工作,实现了从简单信息检索到深度研究的质变。

3. 高质量数据获取与处理机制

        Step-DeepResearch构建了权威增强信息获取机制:

高质量搜索API:与主流搜索引擎不同,Step-DeepResearch结合了专业搜索API,提高信息获取质量

2000万+高质量文档库:覆盖各领域权威学术文献和行业报告

600+权威站点索引:隔离低质量信源,优先选择高可信度信息源

知识密集检索:采用段落级粒度最大化单token信息密度,提高信息处理效率

动态双循环认知架构:构建"动态规划-分层合成"双循环工作流,规划者Agent初始生成研究大纲后,通过强化学习算法根据新发现持续优化研究路径

4. 训练流程创新

        Step-DeepResearch建立了从智能体中期训练到监督式微调(SFT)和强化学习(RL)的完整优化路径:

Agentic Mid-training:在预训练和微调之间加入Mid-training,通过32K和128K两个阶段的上下文调度,注入原子能力,使模型内化"下一步行动"的决策逻辑,而非简单的"预测下一个Token

渐进式训练流程:从中期训练到监督微调再到强化学习的完整优化路径,使模型能更好地适应复杂多变的研究场景

基于原子能力的数据合成策略:采用"博士级"训练数据生成技术,解决研究数据稀缺难题,同时降低训练成本


二、评测表现与性能对比

        Step-DeepResearch在多项权威基准测试中表现出色,其评测数据如下:


三、总结与展望

        Step-DeepResearch作为一款32B参数的端到端深度研究智能体模型,通过独特的技术架构和创新的训练方法,在多项权威评测中表现优异,其性能已达到与国际顶尖模型Gemini DeepResearch和OpenAI DeepResearch相媲美的水平,而在成本效益上则具有显著优势。

        Step-DeepResearch的核心价值在于将深度研究流程内化为可训练的原子能力,通过单智能体架构实现从规划、检索、反思到报告生成的全闭环工作流。这种能力使AI研究助手能够像人类专家一样思考和工作,解决了传统AI研究工具在信息整合、逻辑分析和质量控制方面的不足。

核心价值 (CORE VALUE):

        Step-DeepResearch的核心价值在于将深度研究流程内化为可训练的原子能力,通过单智能体架构实现从规划、检索、反思到报告生成的全闭环工作流。

Logo

中科创新烁智(CSCITech)

更多推荐