人工智能大模型的竞赛场上,又添了一位重量级选手。近日,美团正式对外发布了其最新研发的万亿参数大模型——LongCat-2.0,并宣布全面开源,旨在推动行业技术交流与应用落地。
LongCat-2.0 展现了国产算力集群的强大潜能。据悉,该模型是在五万卡国产算力集群上完成的全流程训练与推理,不仅验证了国产软硬件在大规模分布式计算中的可靠性,也为业内构建超大规模模型提供了参考范式。从技术规格上看,LongCat-2.0 总参数量高达 1.6T,采用动态范围设计(激活参数约 48B,动态范围覆盖 33B 至 56B),这种设计在保证海量知识储备的同时,兼顾了推理的灵活性与效率。
在数据支撑与上下文处理能力方面,LongCat-2.0 同样表现不俗。其预训练数据规模超过 30T tokens,不仅深度覆盖了中文与英文语料,还融合了多语言及高质量代码数据,实现了跨领域的逻辑理解。更为亮眼的是,该模型原生支持 1M 超长上下文,这意味着它在处理长篇文档分析、复杂代码库构建等任务时,能够保持极高的连贯性与准确度。
此次美团选择将 LongCat-2.0 开源,无疑为开发者社区注入了新的活力。作为一款具备万亿参数量级的开源模型,它不仅标志着美团在人工智能底层技术研发上的持续深耕,也为国内大模型生态的繁荣贡献了重要算力底座。未来,随着该模型的广泛应用,我们有望看到更多基于超长上下文理解的创新 AI 应用涌现。
