当前位置:首页 > AI资讯 > 正文内容

蚂蚁百灵开源Ring-2.6-1T:Agent能力迎来新拐点

admin2周前 (05-15)AI资讯86

蚂蚁百灵 Ring-2.6-1T 开源:当“思考”变得可调控,Agent 能力迎来新拐点

在 AI 模型竞争日益白热化的当下,参数规模与榜单分数早已不是唯一的衡量标准。真正决定模型价值的,是它能否在真实场景中高效、稳定地解决问题。5 月 15 日,蚂蚁百灵正式开源其旗舰级思考模型 Ring-2.6-1T,不仅带来了接近顶尖水平的推理性能,更通过“按需思考”的设计理念,为 Agent 应用的落地开辟了新路径。

“按需思考”:推理资源的智能分配

Ring-2.6-1T 最引人注目的创新,在于其引入的 Reasoning Effort 机制。这一机制允许开发者在 high 与 xhigh 两种推理强度之间灵活切换,实现“按需分配”计算资源。

  • high 模式 专为高频 Agent 工作流优化,强调效率与响应速度。在 PinchBench 评测中,该模式得分 87.60,优于 GPT-5.4 xHigh 和 Gemini-3.1-Pro high;在电信领域任务 Tau2-Bench 中更是达到 95.32 的高分,充分展现了其在多轮对话、工具调用与任务拆解等实际场景中的强大执行力。
  • xhigh 模式 则面向数学竞赛、科研分析等高难度任务,释放模型的极限推理能力。在 AIME 26(美国数学邀请赛)中,该模式取得 95.83 分的惊人成绩,接近多家头部模型的顶尖水平;在 GPQA Diamond 科学推理评测中也拿下 88.27 分,体现出扎实的知识理解与复杂逻辑推演能力。

这种“双模式”设计,本质上是对“Token Efficiency”理念的深化——不再盲目追求高消耗的推理,而是根据任务需求动态调整资源投入,实现性能与成本的最优平衡。

异步强化学习:训练架构的底层革新

支撑 Ring-2.6-1T 高性能的,是其背后创新的训练架构。传统同步强化学习(RL)常面临 GPU 资源等待、训练吞吐不足的问题,限制了模型的持续进化能力。蚂蚁百灵采用 异步(Async)强化学习架构,将策略采样与参数更新解耦为独立流水线,显著提升了训练效率与稳定性。

在此基础上,团队还将曾在 Ring-1T 中验证有效的“棒冰算法”引入异步 RL 训练,有效缓解了训练过程中的波动与不收敛问题。这一技术组合不仅加快了模型迭代速度,也为长期、大规模的持续训练提供了可能。尽管具体技术细节尚未完全公开,但这一架构的成熟应用,标志着蚂蚁在模型训练工程化层面迈出了关键一步。

从“刷榜”到“实用”:百灵模型的开源哲学

值得注意的是,近一个月内,蚂蚁百灵已陆续开源多款模型,涵盖 Ling 语言模型与 Ring 推理模型两大系列。与部分厂商追逐更大参数、更高单点分数不同,百灵更强调“真实生产环境使用”的价值导向。

其核心策略是 Token Efficiency——用更少的 token 完成更高质量的任务输出。这一理念在 Ling-2.6-flash 的匿名测试版本“Elephant Alpha”上得到验证:上线 OpenRouter 后连续多日位列 Trending 榜首,日均 token 调用量突破 100B 级别,说明市场对其效率与实用性给予了高度认可。

Ring-2.6-1T 的开源,正是这一哲学的延续。它不仅提供了强大的推理能力,更通过可调节的 Reasoning Effort 机制,让开发者能够根据业务场景灵活调配资源,真正实现“好钢用在刀刃上”。

开源的意义:推动 Agent 生态的普惠发展

将 Ring-2.6-1T 的权重文件同步上线 Hugging Face 与 ModelScope 平台,体现了蚂蚁百灵推动技术普惠的决心。开源不仅降低了开发者使用先进推理模型的门槛,也为学术界与产业界提供了研究高能效 Agent 系统的重要基础。

在 AI Agent 逐渐渗透金融、医疗、客服等行业的今天,一个既能高效执行日常任务,又能应对复杂推理挑战的开源模型,无疑将为更多企业构建智能化应用提供坚实支撑。

未来,随着“按需思考”理念的普及与异步训练技术的进一步成熟,我们或许将看到更多兼顾性能与效率的模型涌现。而蚂蚁百灵此次的开源行动,正是这一趋势的重要起点。

标签: AI开源 Agent智能体 蚂蚁百灵 Reasoning Effort Token效率

相关文章

阿里HappyOyster开启AI世界模型新纪元

从“生成”到“演化”:阿里HappyOyster开启世界模型新纪元 当大多数AI模型还在专注于“生成一段视频”时,阿里巴巴用一款名为HappyOyster(快乐生蚝)的产品,悄然将AI内容创作推向了下...

生成式AI ROI达49%,智能体如何落地变现

从试验田到生产线:生成式 AI 与智能体的 ROI 兑现之路 过去几年,生成式 AI 的风潮席卷全球,企业纷纷投入资源进行试点探索。然而,随着技术逐渐成熟,讨论的焦点已从“AI 能做什么”转向“AI...

亚马逊云科技推出Agent注册表破解多云治理难题

当AI Agent泛滥成灾:亚马逊云科技用“注册表”破局多云治理难题 在AI驱动的数字化转型浪潮中,企业正以前所未有的速度构建和部署AI Agent。从客服助手到财务分析工具,从代码生成到跨系统自动化...

AI顶尖人才回流大厂背后的战略逻辑

从独立研究到平台赋能:顶尖AI人才的“回流”逻辑 在AI大模型竞争白热化的当下,人才流动往往被视为行业风向标。近期,前DeepSeek核心研究员、V3与R1模型的核心作者郭达雅确认加入字节跳动Seed...

22岁开发者逆推Claude Mythos架构

当“堆参数”遇上“循环思考”:22岁开发者逆推Claude Mythos架构 在AI大模型领域,“更大即更好”曾是颠扑不破的真理。千亿参数、万亿参数……模型规模一路狂飙,算力成本也随之水涨船高。然而,...

Kimi K2.6工程化突破:从做题到造系统

从“做题”到“造系统”:Kimi K2.6 的工程化跃迁 4月20日深夜,月之暗面悄然发布并开源了其最新旗舰模型 Kimi K2.6。这并非一次常规的模型迭代,而是一场关于 AI 能力边界的重新定义。...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。