法国人工智能初创公司Mistral AI周三宣布全面进军人工智能基础设施领域,将其公司定位为欧洲对美国云计算巨头的有力回应。与此同时,该公司还推出了可与OpenAI最先进系统相媲美的新型推理模型。

这家总部位于巴黎的公司发布了Mistral Compute,这是一个与英伟达(Nvidia)合作构建的综合AI基础设施平台,旨在为欧洲企业和政府提供替代方案,摆脱对亚马逊网络服务(AWS)、微软Azure和谷歌云(Google Cloud)等美国云提供商的依赖。此举标志着Mistral AI的重大战略转变,从单纯开发AI模型转向掌控整个技术栈。

Mistral AI首席执行官兼联合创始人Arthur Mensch表示:“进军人工智能基础设施领域标志着Mistral AI迈出了转型的一步,因为它使我们能够触及人工智能价值链中一个关键的垂直领域。这一转变意味着我们有责任确保我们的解决方案不仅能够推动创新和人工智能的普及,还能维护欧洲的技术自主权,并为其可持续发展领导力做出贡献。”

mistral

Mistral如何构建能够用任何语言思考的推理模型

除了基础设施的宣布,Mistral还发布了其Magistral系列推理模型——这些人工智能系统能够进行逐步逻辑思考,类似于OpenAI的o1模型和中国的DeepSeek R1。然而,Mistral首席科学家Guillaume Lample表示,该公司的方法在关键方面与竞争对手有所不同。

Lample在一次独家采访中透露:“我们一切都是从零开始,主要是因为我们想学习我们现有的专业知识,比如工作中的灵活性。实际上,我们在更强大的在线强化学习流程上做到了非常高效的水平。”与竞争对手经常隐藏推理过程不同,Mistral的模型会向用户展示完整的思维链,并且至关重要的是,它使用用户的母语,而不是默认的英语。Lample解释说:“我们用用户自己的语言,向用户展示了完整的思维链,这样他们就可以真正地阅读,看看它是否有意义。”

该公司发布了两个版本:拥有240亿个参数的开源模型Magistral Small;以及可通过Mistral API使用的更强大的专有系统Magistral Medium。

AI模型训练中获得的“超能力”

这些模型在训练过程中展现出了令人惊喜的能力。最值得注意的是,尽管训练过程仅侧重于基于文本的数学和编码问题,Magistral Medium仍保留了多模态推理能力——即分析图像的能力。

Lample表示:“我们意识到,这并非完全是意外,而是我们绝对没有想到的,如果在强化学习训练结束时,你重新插入初始视觉编码器,那么你会突然发现,模型能够对图像进行推理。”

这些模型还获得了复杂的函数调用能力,可以自动执行多步互联网搜索和代码执行来回答复杂的查询。Lample解释道,模型会像进行网络搜索一样,然后处理结果,甚至在需要时再次搜索。这种行为无需特殊训练即可自然形成,这让团队感到“非常惊喜”。

工程突破:训练速度远超竞争对手

Mistral的技术团队克服了重大的工程挑战,创造了Lample所说的训练基础设施方面的突破。该公司开发了一套“在线强化学习”系统,使AI模型能够在生成响应的同时不断改进,而无需依赖现有的训练数据。

关键创新在于实时同步数百个图形处理单元(GPU)之间的模型更新。Lample解释说:“我们所做的就是找到一种方法,只需通过GPU即可完成模型的迁移。”这使得系统能够在几秒钟内(而不是通常需要的几小时)在不同的GPU集群之间更新模型权重。

Lample指出:“没有哪个开源基础设施能够像它一样妥善地做到这一点。通常情况下,有很多类似的开源尝试来做到这一点,但速度极其缓慢。而在这里,我们非常注重效率。”事实证明,训练过程比传统的预训练更快、更便宜,Lample表示,用不了一周就能完成。

英伟达承诺为欧洲AI独立提供18,000块芯片

Mistral Compute平台将运行在18,000块英伟达最新的Grace Blackwell芯片上,这些芯片最初部署在法国埃松省的一个数据中心,并计划扩展到整个欧洲。英伟达首席执行官黄仁勋表示,此次合作对于欧洲的技术独立至关重要。

黄仁勋在巴黎的联合声明中表示:“每个国家都应该在自己的国家建设人工智能,为本国服务。通过Mistral AI,我们正在开发模型和人工智能工厂,作为欧洲各地企业的自主平台,帮助企业在各个行业扩展智能。”黄仁勋预测,未来两年欧洲的人工智能计算能力将增长十倍,欧洲大陆将规划超过20个“人工智能工厂”。

此次合作不仅限于基础设施,还包括英伟达与其他欧洲人工智能公司以及搜索公司Perplexity合作,开发各种欧洲语言的推理模型,而这些语言的训练数据通常有限。

解决AI的环境和主权问题

Mistral Compute解决了人工智能发展中的两大问题:环境影响和数据主权。该平台确保欧洲客户能够将其信息保存在欧盟境内并受欧洲管辖。

该公司与法国国家生态转型机构和领先的气候咨询公司Carbone4合作,评估并尽量减少其人工智能模型在整个生命周期内的碳足迹。Mistral计划使用脱碳能源为其数据中心供电,并表示“通过选择欧洲作为我们的工厂所在地,我们能够从大量脱碳能源中受益。”

速度优势赋予Mistral推理模型实用优势

早期测试表明,Mistral的推理模型不仅性能出色,而且解决了现有系统普遍存在的一个问题——速度。OpenAI和其他公司目前的推理模型可能需要几分钟才能响应复杂的查询,这限制了它们的实际应用。

Lample指出:“人们通常不喜欢这种推理模型的一点是,尽管它很智能,但有时也会耗费大量时间。而在这里,你实际上只需几秒钟就能看到输出,有时甚至不到五秒,有时甚至更短。这改变了体验。”速度优势对于企业采用来说至关重要,因为等待人工智能响应几分钟会造成工作流程瓶颈。

Mistral基础设施投资对全球人工智能竞争的深远影响

Mistral进军基础设施领域,使其与主导云计算市场的科技巨头展开直接竞争。该公司提供完整的垂直整合解决方案——从硬件基础设施到AI模型再到软件服务。这包括面向开发者的Mistral AI Studio、提升企业生产力的Le Chat和提供编程辅助的Mistral Code。

行业分析师认为,Mistral的战略是区域人工智能发展大趋势的一部分。黄仁勋表示:“欧洲若想保持全球竞争力,就迫切需要扩大其人工智能基础设施。”这与欧洲政策制定者的担忧不谋而合。

这一声明发布之际,欧洲各国政府越来越担心其在关键人工智能基础设施方面对美国科技公司的依赖。欧盟已承诺投入200亿欧元,在欧洲大陆建设人工智能“超级工厂”,而Mistral与英伟达的合作或将加速这些计划的实施。

Mistral宣布推出基础设施和模型功能,表明该公司致力于成为一个全面的AI平台,而不仅仅是一个模型提供商。在微软和其他投资者的支持下,该公司已筹集超过10亿美元,并将继续寻求额外资金来支持其业务范围的扩展。

Lample看到了推理模型未来更大的可能性,他表示:“当我观察内部进展时,我认为在一些基准测试中,该模型的准确率每周都在提高5%,大概持续了六周。所以它正在快速改进,有很多很多,我的意思是,你能想到的无数个小点子都能提升性能。”欧洲挑战美国人工智能主导地位的举措能否成功,最终可能取决于客户是否足够重视主权和可持续性,从而愿意放弃现有供应商。至少目前,他们还有选择。