相关推荐
智谱多模态开源周圆满落幕:四项视频生成核心技术全面开放
智谱团队开源四项视频生成核心技术,包括GLM-4.6V视觉理解、AutoGLM设备控制、GLM-ASR语音识别和GLM-TTS语音合成模型,展示其在多模态领域的最新进展,为视频生成技术发展奠定基础。
2025年12月12号 10:44
149.8k
DeepMind 首席执行官预测 2026 年三大 AI 发展趋势
谷歌DeepMind CEO哈萨比斯在Axios AI+峰会上预测,2026年将是多模态AI、互动视频世界和可靠AI代理快速发展的关键一年。他特别提到,其最新模型Gemini在多模态能力上已取得显著进展,不仅能描述情节,还能深入理解场景深层含义。
2025年12月8号 10:30
194.8k
法国 AI 公司 Mistral 发布新模型,力求与 OpenAI 和谷歌保持竞争
法国AI公司Mistral发布新模型,旨在追赶谷歌、OpenAI等全球领先实验室。此次推出包括号称“最佳开放权重多模态多语言模型”的大型模型,以及适用于机器人设备的小型模型,凸显全球AI领域竞争加剧。
2025年12月3号 9:47
144.1k
商汤NEO开源:用1/10数据量媲美顶级多模态模型,终结"拼凑式"AI时代
商汤科技与南洋理工大学S-Lab联合发布开源多模态模型NEO,通过架构创新实现视觉语言深层统一。该模型仅需3.9亿图像文本数据(为同类模型1/10),即可达到顶尖视觉感知性能,无需海量数据或额外视觉编码器,在效率与通用性上取得突破。
2025年12月3号 9:07
121.8k
快手旗舰 Keye-VL-671B-A37B 重磅发布,多模态推理能力实现新突破
快手发布新一代多模态模型Keye-VL-671B-A37B并开源代码。该模型具备“善看会想”特性,在视觉理解、视频分析和数学推理等核心基准测试中表现优异,强化了视觉感知与跨模态对齐能力,展现快手在AI领域的技术实力。
2025年11月28号 17:36
151.8k
