在近期举办的 Axios AI + 峰会上,谷歌 DeepMind 的首席执行官德米斯・哈萨比斯(Demis Hassabis)分享了他对未来一年 AI 领域的展望。他指出,2026 年将是多模态模型、互动视频世界和更可靠的 AI 代理迅速发展的关键一年。
哈萨比斯强调,DeepMind 的最新 AI 模型 “Gemini” 已在多模态能力方面取得了显著进展。他提到,该模型不仅能够描述情节,还能深入理解场景的深层含义。例如,在影片《搏击俱乐部》中,AI 将一个角色摘掉戒指的动作解读为对日常生活的哲学性放弃。这种深度理解使得 AI 能够生成更复杂的输出,比如信息图表等,之前的技术无法实现这一点。
他还提到,AI 代理将在一年内能够 “接近” 自主处理复杂任务的能力。这一进展符合他在 2024 年 5 月时提出的时间表。DeepMind 的目标是创建一个跨设备的通用助手,帮助用户管理日常生活。为实现这一目标,DeepMind 还在研发名为 “Genie 3” 的 “世界模型”,这种模型能够生成可互动的可探索视频空间,让用户沉浸于虚拟世界中。
划重点:
🌟 多模态模型的进步将推动 AI 理解和生成复杂内容的能力。
🛠️ AI 代理将在不久的将来接近自主处理复杂任务的水平。
🌍 DeepMind 正在研发互动视频空间,为用户提供全新的沉浸式体验。
