4月10日,智谱正式发布并开源了新一代旗舰模型 GLM-5.1。这款模型最显著的突破在于其长程任务(Long-Horizon Task)处理能力,成为了全球首个能实现“8小时连续工作”的开源模型。

image.png

核心突破:从“一问一答”到“自主办公”

智谱团队指出,大模型的下一阶段标准不再是简单的榜单分数,而是“能独立工作多久”:

  • 8小时级续航: GLM-5.1能够在一次任务中独立、持续工作超过8小时。期间它可以自主规划、执行、定位瓶颈并自我进化,最终交付工程级成果。

  • 代码能力登顶: 在衡量专业软件开发的 SWE-bench Pro 基准测试中,GLM-5.1实现了国产模型对海外顶尖模型Opus4.6首次超越。

  • 实测性能惊人: 在针对海量数据检索系统的编程测试中,GLM-5.1经过6000多次操作优化,最终运行速度达到了此前最好成绩的6倍。

image.png

行业风向:告别“价格战”,转向“性能溢价”

随着性能的跨越式提升,智谱的定价策略也发生了重大转向:

  • 价格追平海外: 平台数据显示,GLM-5.1再次提价10%。在编码场景下的定价已首次追平海外头部厂商Anthropic

  • 回归商业价值: 智谱 CEO 张鹏表示,长期低价竞争不利于行业,调价是为了将 AI 价值拉回正常区间。目前智谱已实现全球范围内的价值变现,API 业务 ARR(年度经常性收入)同比提升达60倍。

市场趋势:底层算力与模型集体步入“涨价潮”

2026年开年以来,国内 AI 行业正经历从“低价换量”到“价值定价”的集体转型:

  • 腾讯云: 宣布 AI 算力及容器服务等产品统一上调5%。

  • 阿里云: AI 算力相关产品价格上调5%-34% 不等。

  • 百度智能云: 相关 AI 算力服务上调5%-30%。

结语:AGI 的“时间线”

业内共识认为,衡量 AGI 的重要指标是任务完成的时间线。前沿模型独立完成任务的时间每7个月翻一倍。随着GLM-5.1开启“8小时工作模式”,大模型正从一个随问随答的聊天机器人,正式转变为一个能够深度参与复杂工程的“虚拟员工”。