相关推荐
用一个密钥,打开全球AI的能力边界 ——我们正在打造面向未来的“全球AI聚合网关”
过去两年AI技术快速发展,ChatGPT和多模态模型推动变革,企业和开发者积极应用AI提升生产力。但实际落地面临四大挑战:模型接口标准不统一、成本管理复杂、数据安全合规要求高、混合模型调用缺乏统一管理。这些问题制约了AI的规模化应用。
2025年10月23号 11:53
387.8k
字节跳动推出 Sa2VA:结合 LLaVA 与 SAM-2 实现多模态智能分割
字节跳动联合高校推出Sa2VA模型,结合LLaVA视觉语言模型与SAM-2分割模型,能理解视频内容并精确追踪分割角色和物体。LLaVA擅长宏观叙事,SAM-2精于细节分割,互补提升视频分析能力。
2025年10月21号 17:13
157.3k
全面开源的 LLaVA-OneVision-1.5,超越 Qwen2.5-VL 的多模态模型登场
开源社区推出LLaVA-OneVision-1.5多模态模型,实现技术突破。该模型历经两年发展,从基础图文对齐升级为能处理图像、视频的综合框架,核心提供开放高效的可复现训练架构,支持用户便捷构建高质量视觉语言模型,训练过程分三个阶段推进。
2025年10月17号 10:08
153.6k
苹果即将在2025年国际计算机视觉大会亮相
苹果公司将在2025年10月檀香山举办的国际计算机视觉大会(ICCV)上展示八篇论文,聚焦多模态模型和视频生成等前沿技术,分享其在计算机视觉领域的最新研究成果。
2025年10月14号 14:38
89.8k
马斯克挖角 NVIDIA 核心团队,xAI 加速 “世界模型” 研发
马斯克旗下xAI公司正加速开发“世界模型”,以推动通用人工智能(AGI)发展。为此,公司从英伟达挖来两位核心研究员Zeeshan Patel和Ethan He,他们在Omniverse平台有重要贡献,将为xAI带来技术专长。
2025年10月13号 14:19
130.2k
