在刚刚公布的 SuperCLUE-VLM12月多模态视觉语言基准测评中,全球 AI 大模型展现出了极强的竞争态势。本次测评从基础认知、视觉推理以及视觉应用三个核心维度展开,全方位考察了各大模型的“眼力”与“脑力”。

在此次角逐中,谷歌推出的
此外,百度 ERNIE-5.0-Preview 与阿里巴巴的 Qwen3-vl 也成功进入榜单前五。其中,Qwen3-vl 更是成为榜单中首个总分突破70分大关的开源模型,为开源社区贡献了极强的视觉解析能力。
相比之下,部分国际老牌劲旅的表现略显乏力。Anthropic 的 Claude-opus-4-5获得71.44分,而 OpenAI 的 GPT-5.2(high) 则意外跌出第一梯队,仅以69.16分排名靠后。这一排名的变动,也标志着多模态 AI 领域的竞争正进入白热化的阶段。
划重点:
🏆 全球领跑:谷歌 Gemini-3-pro 以83.64分夺冠,在基础认知、视觉推理和应用三项指标上均位列第一。
🇨🇳 国产爆发:商汤 SenseNova 与字节跳动豆包分列二、三名,展现了中国大模型在视觉理解领域的强劲竞争力。
📊 行业洗牌:Qwen3-vl 成为首个破70分的开源模型,而 GPT-5.2(high) 在本次视觉测评中表现不及预期,位居后列。
