相关推荐
中国科大与字节发布 MoGA 长视频生成模型:分钟级多镜头短片一键生成
中科大与字节跳动联合推出端到端长视频生成模型,能直接生成分钟级、480p分辨率、24fps的高质量视频,支持多镜头切换。核心创新是底层算法MoGA,这是一种全新注意力机制,专攻长视频生成难题,标志着国产视频生成技术实现关键突破。
2025年10月24号 14:30
155.5k
字节跳动AI助手Cici在海外多国应用榜登顶:与国内豆包采用双品牌策略
字节跳动AI助手Cici在海外市场表现亮眼,墨西哥谷歌商店下载量居首,英国苹果商店进入前十。该应用与国内豆包同期推出,采用双品牌出海策略,开发者身份虽未公开标注,但字节跳动已向《福布斯》确认。
2025年10月21号 9:51
137.7k
谷歌 AI 视频生成工具 Flow 升级:编辑更灵活,音频功能强大
谷歌升级AI视频生成工具Flow,新增光影编辑功能,提升视频真实感和制作灵活性。音频方面也获重大增强,用户可调整光影效果,使生成内容更自然。
2025年10月16号 8:53
131.1k
谷歌AI Plus低价套餐扩展至40多个国家,月费5美元与OpenAI争夺新兴市场
谷歌加速AI服务全球化,推出更实惠的AI Plus订阅计划,现已覆盖40多个国家,包括安哥拉、印度尼西亚、墨西哥等。该计划本月从印尼首发,月费约4.5美元,旨在扩大AI服务在发展中市场的普及。
2025年9月25号 13:51
84.3k
颠覆传统!Mini-o3 开源模型实现超长视觉推理,深度思考不再是难题
近日,字节跳动与香港大学联合推出了一款全新的开源视觉推理模型 ——Mini-o3,标志着多轮视觉推理技术的又一重大突破。与以往只能进行1-2轮对话的视觉语言模型(VLM)不同,Mini-o3在训练时限制了对话轮数为6轮,但在测试阶段却能将推理轮数扩展至数十轮,极大提升了视觉问题处理的能力。Mini-o3的强大之处在于其在高难度视觉搜索任务中实现了深度推理,达到当前技术的顶尖水平。这得益于该模型的三个核心设计要素。首先,研究团队构建了一个名为 VisualProbe 的视觉探测数据集,包
2025年9月16号 10:00
134.9k
