智谱AI今日正式发布新一代旗舰模型GLM-4.5,这是一款专为智能体应用打造的基础模型,现已在Hugging Face与ModelScope平台同步开源,模型权重遵循MIT License开源协议。
开源SOTA性能,国产模型领跑
GLM-4.5在包含推理、代码、智能体的综合能力方面达到开源SOTA水平,在真实代码智能体的人工对比评测中实测表现为国内最佳。通过对12个最具代表性的评测基准进行综合评估,包括MMLU Pro、AIME24、MATH500、SciCode等权威测试,GLM-4.5取得了全球模型第三、国产模型第一、开源模型第一的优异成绩。
原生融合三大核心能力
GLM-4.5首次在单个模型中实现推理、编码和智能体能力的原生融合,满足智能体应用的复杂需求。这一技术突破体现了智谱AI对AGI第一性原理的完整呈现:在不损失原有能力的前提下融合更多通用智能能力。
高参数效率的MoE架构
GLM-4.5采用混合专家(MoE)架构,提供两个版本:GLM-4.5总参数量3550亿,激活参数320亿;GLM-4.5-Air总参数1060亿,激活参数120亿。值得注意的是,GLM-4.5参数量仅为DeepSeek-R1的1/2、Kimi-K2的1/3,但在多项标准基准测试中表现更为出色,在SWE-bench Verified榜单上位于性能/参数比帕累托前沿。
双模式设计与训练流程
模型支持两种运行模式:用于复杂推理和工具使用的思考模式,以及用于即时响应的非思考模式。训练流程包括在15万亿token通用数据上的预训练,随后在代码、推理、智能体等领域8万亿token数据上进行针对性训练,最后通过强化学习进一步增强模型能力。
极致性价比突破行业定价
GLM-4.5系列在成本和效率上实现重大突破,API调用价格远低于主流模型:输入仅需0.8元/百万tokens,输出2元/百万tokens。高速版本实测生成速度最高可达100tokens/秒,支持低延迟、高并发的实际部署需求。
全栈开发能力与生态兼容
GLM-4.5系列能胜任全栈开发任务,具备前端网站编写、后端数据库管理以及工具调用接口支持等能力。模型深度优化全栈编程与工具调用,兼容Claude Code、Cline、Roo Code等主流代码智能体框架,一键兼容Claude Code框架。
多平台体验与透明评测
用户可通过BigModel.cn开放平台调用API,也可在智谱清言(chatglm.cn)和z.ai免费体验完整功能。为确保评测透明度,智谱AI公布了52道题目及Agent轨迹供业界验证复现。
GLM-4.5的发布标志着智能体应用开发迎来新的技术底座,其原生融合的核心能力、极致的性价比以及广泛的生态兼容性,有望推动AGI技术在各行各业的规模化应用和商业价值实现。