阿里千问大模型家族迎来重磅更新。Qwen3.5-Max-Preview 作为千问 3.5 系列的旗舰预览版,正式亮相全球权威大模型评测平台 LM Arena,并凭借 1464 分的综合得分刷新纪录。

排名跃升:稳居中国大模型首位
在 LMSYS 组织的这一匿名盲测竞技场中,阿里千问表现强劲:
全球排名:通义千问在总榜单中位列全球第五,是排名最高的中国大模型。
分项能力:数学能力排名全球第五,专家级文本处理能力位列全球第十。
纯性能对比:在排除风格控制因素的绝对胜率比拼中,其整体性能位居全球第六。
自农历除夕以来,通义千问已密集开源了 Qwen3.5 系列的多款模型,构建了完整的技术生态:
参数规模:涵盖从 0.8B 到 397B 共 8 种不同尺寸,确保在各种硬件环境下均有顶尖表现。
架构优势:以 Qwen3.5-Plus 为例,其采用 3970 亿总参数量、170 亿激活参数的 MoE 架构,实现了低功耗与高性能的平衡。
持续进化:本次亮相的 Max-Preview 版本旨在通过预览测试收集反馈,为后续正式版的迭代打下基础。
LM Arena 因其“模型匿名对战、全球开发者投票”的机制,被公认为最难“刷榜”且最具实战参考价值的榜单。通义千问此次登顶,标志着国产大模型在通用能力、逻辑推理及多语言理解方面已正式迈入全球第一梯队。
目前,通义千问 3.5 系列已在阿里云百炼平台及开源社区全面上线,持续助力各行业实现 AI 应用的深度落地。
