百灵大模型今日正式宣布开源其万亿级旗舰思考模型Ring-2.6-1T,旨在攻克大模型在真实生产环境中“执行力不足”的痛点。该模型不仅是参数规模的堆叠,更是核心转向对 Agent 工作流、软件工程及科研分析等长链路任务的端到端推进。

QQ20260515-091720.jpg

技术层面,Ring-2.6-1T 实现了三大核心突破:首先是 Agent 执行能力的全面增强,在 PinchBench 与 ClawEval 等评估 Agent 适配能力的基准测试中达到开源 SOTA 水平,显著优化了任务拆解与反馈修正能力;

其次,创新性引入“Reasoning Effort”可调节机制,支持 highxhigh 双档位推理强度,使开发者能根据任务复杂度平衡成本与性能,其中 high 档在 Tau2-Bench 电信业务测试中表现优异,而 xhigh 档在 AIME26及 GPQA Diamond 等高难推理任务中触达能力上限;

最后,模型采用异步(Async)强化学习架构结合“棒冰算法”,有效解决了万亿级模型长周期训练的稳定性难题,大幅提升了资源利用率。

目前,Ring-2.6-1T 已在Hugging FaceModelScope开放权重。尽管团队坦诚其在 Long-Horizon 长程交付稳定性上仍有优化空间,但该模型的开源标志着 AI 正从单一的对话交互向具备自主规划与工具协作能力的执行引擎发生质变,为全球开发者提供了探索复杂自动化流程的底层支撑。