在追求大模型“高智商”的同时,AI 的持续执行能力正成为衡量其进化水平的新维度。根据人工智能研究机构

测试结果显示,
AIbase 注意到,虽然测试数据中出现了模型理论上可连续工作超过20小时的数值,但
然而,也有专家对该测试的局限性提出了质疑。目前 METR 仅涵盖了14个样本,且有观点认为这种基准测试可能被模型针对性地“刷分”。但不可否认的是,

在追求大模型“高智商”的同时,AI 的持续执行能力正成为衡量其进化水平的新维度。根据人工智能研究机构

测试结果显示,
AIbase 注意到,虽然测试数据中出现了模型理论上可连续工作超过20小时的数值,但
然而,也有专家对该测试的局限性提出了质疑。目前 METR 仅涵盖了14个样本,且有观点认为这种基准测试可能被模型针对性地“刷分”。但不可否认的是,
生数科技与清华TSAIL实验室联合开源TurboDiffusion视频生成加速框架,实现最高200倍推理加速,且几乎不影响生成质量,突破视频生成关键瓶颈。
钉钉发布企业级AI硬件DingTalk Real,旨在为企业“Agent”角色提供智能终端支持。该设备作为AgentOS执行终端,具备读取内部数据、实时处理及实体交互三大核心功能,致力于改变传统设备服务模式,提升企业内部网络运作效率。
OpenAI推出类似Spotify Wrapped的年度回顾功能,为用户提供个性化使用报告,并根据对话习惯授予特定称号。
面壁智能完成数亿元融资,投资方包括京国瑞、国科投资等。资金将重点投入端侧高效大模型的研发,以巩固其在终端智能市场的技术优势。作为国内端侧AI领域的先行者,公司已构建从理论到全场景产品的完整体系。
生成式AI在游戏行业应用广泛,Steam平台已有超1万款游戏使用该技术,占比约8%,且数量持续增长。这些游戏总收入达6.6亿美元,有力反驳了“只有劣质游戏才用AI”的偏见。