大模型也有“ 8 小时工作制”！智谱 GLM-5.1 发布：长程任务能力首次超越 Opus 4.6

4月10日，智谱正式发布并开源了新一代旗舰模型 GLM-5.1。这款模型最显著的突破在于其长程任务（Long-Horizon Task）处理能力，成为了全球首个能实现“8小时连续工作”的开源模型。

智谱团队指出，大模型的下一阶段标准不再是简单的榜单分数，而是“能独立工作多久”:

随着性能的跨越式提升，智谱的定价策略也发生了重大转向:

价格追平海外: 平台数据显示，GLM-5.1再次提价10%。在编码场景下的定价已首次追平海外头部厂商Anthropic。
回归商业价值: 智谱 CEO 张鹏表示，长期低价竞争不利于行业，调价是为了将 AI 价值拉回正常区间。目前智谱已实现全球范围内的价值变现，API 业务 ARR（年度经常性收入）同比提升达60倍。

2026年开年以来，国内 AI 行业正经历从“低价换量”到“价值定价”的集体转型:

结语:AGI 的“时间线”

业内共识认为，衡量 AGI 的重要指标是任务完成的时间线。前沿模型独立完成任务的时间每7个月翻一倍。随着GLM-5.1开启“8小时工作模式”，大模型正从一个随问随答的聊天机器人，正式转变为一个能够深度参与复杂工程的“虚拟员工”。

李开复：开源模型是实现“AI主权”的更优路径

李开复提出“AI主权”概念，强调其涉及技术控制、数据安全及模型与本土文化法律的适配。他认为各国不必盲目重造OpenAI，闭源自研成本高且不现实。对资源有限的国家和企业，基于开源模型构建本地化体系是更可行的“第三条路”。

GLM-5.1 发布：一个能独立工作的智能模型，持续作业长达 8 小时

GLM-5.1开源模型在智能水平上实现突破，能独立处理长达8小时的复杂工程项目。相比以往模型，其在代码能力和长程任务执行方面显著提升。该模型在全球开源模型中表现优异，于多个代码评测基准取得佳绩，尤其在SWE-Bench Pro测试中成功定位并修复高难度工程Bug，超越现有顶级模型。

李开复：开源模型是实现“AI主权”的更优路径